® BUNDESREPUBLIK 
DEUTSCHLAND 




<© Offenlegungsschrift 
® DE 199 14 808 A1 



DEUTSCHES 
PATENT- UNO 
MARKENAMT 



® Aktenzeichen: 
(§) Anmeldetag: 
® Offenlegungstag: 



199 14808.2 
31. 3.1999 
19. 10. 2000 



® Int. CI. 7 : 

C 07 H 21/00 

C 07 H 1/00 r- 
C 07 B 61/00 <J 

00 



C 12 N 15/63 
C 12 Q 1/68 



00 

o> 
o 

UJ 

Q 



(73) Anrnelder: 

Rauhe, Hilmar, 45128 Essen, DE 

@ Vertreten 

Reinert, P., Dipl.-Biol. Dr.rer.nat., Pat.-Anw., 50935 
Koln 



@ Erfinder: 

Rauhe, Hilmar, 45128 Essen, DE; Feldkamp, Udo, 
47057 Duisburg, DE; Banzhaf, Wolfgang, 44359 
Dortmund, DE; Howard, Jonathan, 50931 Koln, DE 

(56) Entgegenhaltungen: 

US 5843 661 
Chem. Abstr. 125(1996)194609y; 



Die folgenden Angaben sind den vom Anrnelder eingereichten Unterlagen entnommen 

Prufungsantrag gem. § 44 PatG ist gestellt 
(3) Informationstragende Polymere 

(§) Die Erfindung betrifft Verfahren zur Hersteilung infor- 
mationstragender Polymere, nach diesen Verfahren er- 
haltliche informationstragende Polymere; Verfahren zur 
Isolierung, zur Vervielfaltigung iund zum Auslesen solcher 
informationstragender Polymere; polymere Datenspei- 
cher und DNA-Computer, die informationstragende Poly- 
mere umfassen sowie die Verwendung informationstra- 
gender Polymere zur Hersteilung von Molekulargewichts- 
standards, als Marker oder Signaturen, zur Verschlusse- 
lung von Information, als molekulare Kleber oder zur Her- 
steilung oder Bearbeitung kleinster molekularer Struktu- 
ren. 
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Beschreibung 

Die Erfindung betrifft Verfahren zur Herstellung informationstragender Polymere, nach diesen Verfahren erhaltliche 
informationstragende Polymere; Verfahren zur Isolierung, zur Vervielfaltigung und zum Auslesen solcher information s- 
5 tragender Polymere; polymere Datenspeicher und DNA-Computer, die informationstragende Polymere umfassen sowie 
die Verwendung informauonstragender Polymere zur Herstellung von Molekulargewichtsstandards, als Marker oder Si- 
gnaturen, zur Verschlusselung von Information, als molekulare Kleber oder zur Herstellung oder Bearbeitung kleinster 
molekularer Strukturen. 

Es ist bekannt, Nukleinsauren wie DNA (Deoxiribonucleic Acid = Desoxyribonukleinsaure) und RNA (Ribonucleic 

10 Acid = Ribonukleinsaure) auch aufierhalb von Organismen zur Informationsverarbeitung zu verwenden. Es wurden bis- 
her verschiedene Ansatze, DNA Molekule zur Informationsverarbeitung zu verwenden, vorgestellt. Die WO 97/07 440 
und [L. M. Adleman, Molecular Computation of Solutions to Combinatorial Problems, Science, 266, 1021-1024, 
(1994)] beschreiben ein Verfahren, einen Graphen- Algorithmus ("Hamiltonian-Pf ad-Problem") als Entscheidungspro- 
blem mit Hilfe von DNA Molekiilen zu berechnen. Der Algorithmus wird implementiert, indem die Kariten und Knoten 

15 des Graphen als DNA Sequenzen reprasentiert werden. Die Berechnung des Algorithmus wird dadurch vorgenommen, 
daB durch die Hybridisierung komplementarer DNA Sequenzen eine Menge von Pfaden des Graphen erzeugt werden. 

Aus dieser Menge von Pfaden werden dann mit Hilfe molekularbiologischer Verfahren alle Pfade entfernt, die eine fal- 
sche oder keine Losung des Algorithmus sind. Wurden alle Schritte erfolgreich ausgefuhrt, so muB am Ende entweder 
mindestens ein DNA Strang ubrigbleiben, der die richtige Losung des Problems enthalt, oder es bleibt kein DNA Strang 

20 iibrig, was bedeutet, daB der Algorithmus keine Losung hat 

Das beschriebene Verfahren setzt voraus, daB geniigend viele Molekule zur Verfugung stehen, damit jede mogliche 
Losung der jeweiligen Probleminstanz statisusch mindestens einmal in der Ausgangsmenge von Pfaden vorkommt. Dies 
kann aufgrund der statisuschen Natur der Hybridisierungsvorgange jedoch nicht garantiert werden. AuBerdem konnen 
im ersten Schritt auch zyklische Graphen entstehen^ was von vomeherein die Menge falscher Losungen vergroBert. 

25 Der in WO 97/07 440 beschriebene Ansatz zeigt, daB Symbolverarbeitung uberhaupt in vitro mit DNA Molekiilen 
vorgenommen werden kann. Jedoch ist der beschriebene Ansatz in der Praxis kaum verwendban Ein Problem ist, daB der 
Algorithmus nicht deterministisch, sondern nur stochastisch ist, das gefundeneErgebnis ist damit nur mit einer bestimm- 
ten Wahrscheinlichkeit korrekt. Ein weiteres Problem ist, daB die Implementierung des Algorithmus nicht effizient 
(Laufzeit-optimal) ist, dadurch wird die Berechnung langsam. Es wird dargelegt, daB das verwendete Verfahren zur Lo- 

30 sung NP-vollstandiger Probleme (einer Klasse von Problemen, fur die nur deterministische Losungsalgorithmen mit ex- 
ponentieller Laufzeit bekannt sind und von der vermutet wird, daB es keine effizienten deterministischen Losungsalgo- 
rithmen gibt) besonders gut geeignet sei, weil der Algorithmus aufgrund der Parallelitat der ausgefuhrten Operationen 
nur lineare Laufzeit benotige. Diese Argumentation ist jedoch insofern fehlerhaft, als die lineare Laufzeit durch eine ex- 
ponentielle Anzahl von Molekiilen kompensiert wird. Die exponentielle ProblemgroBe bleibt also unverandert bestehen. 

35 Insgesamt ist das in der WO 97/07 440 beschriebene Verfahren zu sehr eingeschrankt, um fur molekulare Informati- 
onsverarbeitung liber den beschriebenen Algorithmus hinaus verwendbar zu sein: Das Hamiltonian-Pf ad-Problem ist fest 
kodiert, andere Algorithmen konnen damit nicht berechnet werden, jede Probleminstanz muB neu kodiert werden. Pro- 
grarnmierung ist nicht vorgesehen, alle Schritte des Algorithmus werden von Hand ausgefuhrt. Ein Input-/Output-Sy- 
stem ist nicht vorgesehen. Insgesamt ist das Verfahren zur Programmierung von Algorithmen oder zur Implementierung 

40 eines Computers nicht geeignet. Die WO 97/29 117 und [Frank Guarnieri, Makiko Fliss, Carter Bancroft, Making DNA 
Add, Science, 273, 220-223, (1996)] beschreiben ein Verfahren, Additionen mit Hilfe von DNA Molekiilen auszufuh- 
ren. Die Addition erfolgt als Schiebeoperation mit Uberlauf-Ubertrag in vitro mit DNA Molekiilen und Primer-Elonga- 
tion. 

Das beschriebene Verfahren beschreibt ausschlieBlich Additionen. Jedoch ist selbst die Verwendung als Addierer aus 

45 mindestens zwei Griinden ungunstig: Zum einen ist Addition mit dem beschriebenen Verfahren nicht effizient (Laufzeit- 
optimal) implementiert. Zum anderen ist das verwendete System formal unvollstandig, weil die durch Addition erzeug- 
ten Ergebnisse ihrerseits nicht mehr als Zahlen fur Berechnungen verwendet werden konnen. Uber die Addition hinaus- 
gehende Konzepte fehlen. Insgesamt ist das Verfahren zur Programmierung von Algorithmen oder zur Implementierung 
eines Computers nicht geeignet. 

50 In [Qi Ouyang, Peter D. Kaplan, Shumao Liu, Albert Libchaber, DNA Solution of the Maximal Clique Problem, Sci- 
ence, 278, 446-449, (1997)] wird ein Verfahren beschrieben, einen Algorithmus zur Losung des "Max^Clique-ProblenTs 
zu implementieren. Der Algorithmus stammt aus der Graphentheorie und fallt unter die NP- vollstandigen Probleme. Wie 
in [L. M. Adleman, Molecular Computation of Solutions to Combinatorial Problems, Science, 266, 1021-1024, (1994)] 
ist das Verfahren nur in der Lage, einen fest kodierten Losungsalgorithmus zu berechnen. Auch hier wird das Eigebnis 

55 nur mit einer bestimmten Wahrscheinlichkeit erhalten. Das von den Autoren beschriebene Verfahren enthalt keine wei- 
terfuhrenden Konzepte (etwa in Hinsicht der Implementierung auch anderer Algorithmen). Insgesamt ist das \%rfahren 
zur Programmierung von Algorithmen oder zur Implementierung eines Computers nicht geeignet. 

In [Erik Winfree, Xiaoping Yang, Nadrian C. Seeman, Universal Computation via Selfassembly of DNA: Some 
Theory and Experiments, Proceedings of the 2nd DIMACS Meeting on DNA Based Computers, Princeton University, 

60 June 20-12, (1996)] wird erortert, regulare Grammatiken in DNA durch Verknupfung von Oligonukleotiden mit "sticky 
ends" zu implementieren. Die Ausfuhrungen sind jedoch rein theoretischer Natur und scheitem an wesentlichen, bisher 
ungelosten Problemen. Insbesondere wird nicht dargelegt, wie die zur Implementierung von Grammatiken benotigten 
Sequenzen konstruiert werden miissen. Gerade dies ist aber das entscheidende Problem, ohne dessen Losung Gramma- 
tiken nicht implementiert werden konnen. Der Grund dafur liegt darin, daB die Sequenzen, die die 'Variablen und Termi- 

65 nale einer Grammatik reprasentieren, sowohl eindeutig, als auch untereinander hinreichend unahnlich sein miissen. Au- 
Berdem miissen sie bestimmte strukturelle, chemische und physikalische Eigenschaften erftillen. Andernfalls sind Fehl- 
hybridisierungen zwischen Sequenzen zwangslaufig, diebei der Polymerisierung zu ungewollten Kettenverlangerungen 
und Kettenabbruchen fuhren und damit das Funktionieren des Verfahrens uhmoglich machen. Dieses Problem verscharft 
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sich mit der Anzahl der benotigten Sequenzen exponenliell. 

Das beschriebene Verfahren wird von den Autoren selbst wieder verworfen, bzw. insofern als unzureichend bezeich- 
net, als es keine sonderlich interessanten Berechnungen erlaube (Erik Winfree, Xiaoping Yang, Nadrian C. Seeman, Uni- 
versal Computation via Self-assembly of DNA: Some Theory and Experiments, Proceedinsrs of the 2nd DIMACS Mee- 
ting on DNA Based Computers, Princeton University, June 20-12, (1996), S. 8, 2. Absatz, 1 . Zeile). Weiterfuhrende Ex- 5 
perimente der Autoren stutzen sich entsprechend auch nicht weiter auf regulare Grammatiken und lineare Polymere, son- 
dern auf kontextsensitive Grammatiken zur Erzeugung von DNA Gitterstrukturen [Erik Winfree, Furong Liu, Lisa A. 
Wenzler & Nadrian C. Seeman, Design and self-assembly of two-dimensional DNA crystals, Nature, 394, 539-544, 
(1998)]. Der von den Autoren beschriebene Ansatz ist womdglich zur Erzeugung DNAbasierter Nanostrukturen (Her- 
stellung von Katalysatoren usw.) geeignet. Zur Informations verarbeitung eignet er sich hingegen nicht, hier sind die er- 10 
zeugten Gitterstrukturen eher hinderlich. 

Zwar sprechen die Autoren von der Moglichkeit, das mathematische Konzept der "Wang tiles" durch die erzeugten 
Gitterstrukturen zu realisieren und damit potentiell auch fur Berechnungen zu verwenden, sie bleiben aber bei derbloBen 
Erwahnung einer soichen Moglichkeit, ohne zu beschreiben, wie dies im Sinne einer Informationsverarbeitung genutzt 
werden kann. 15 

Es ist uberhaupt zweifelhaft, ob der von den Autoren beschriebene Ansatz uberhaupt zu einer Informationsverarbei- 
tung geeignet ist: Die Gitterstrukturen verhindern die Vervielfaltigung information stragender Sequenzen (z. B. durch 
Klonierung oder PGR = Polymerase Chain Reaction = Polymerase Kettenreaktion) und machen es unmoglich, die er- 
zeugten Strukturen als Daten zu verwenden, weil diese nicht mehr, etwa durch PCR, ausgelesen werden konnen. Entspre- 
chend sieht der gewahlte Ansatz in der jetzigen Form konzeptionell gar keine Moglichkeit vor, die erzeugten Strukturen 20 
im Sinne einer Informationsverarbeitung, etwa als Daten, zu nutzen. 

Aus dem Stand der Technik ist bisher kein Verfahren bekanrit, das es eriaubt, DNA Molekuie fur die Implementierung 
effizienter Algorithmen zu verwenden. Es ist kein Verfahren bekannt, Berechnungen automatisch (etwa in Art eines mo- 
% lekularen Computers) durchzufuhren. Es ist auch kein Verfahren bekannt, Programme in Form von regularen Gramma- 

tiken mit molekularen Verfahren so zu implementieren, daB damit 25 

a) unterschiedliche (im Idealfall beliebige) regulare Grammatiken implementiert werden konnen 

b) die mit regularen Grammatiken erzeugten Worter einer Sprache ausgelesen werden konnen 

c) die mit regularen Grammatiken erzeugten Worter einer Sprache fur technische Zwecke (z. B. Informationsver- 
arbeitung, Polymerchemie) weiterverwendet werden konnen. 30 

Der vorliegenden Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren bereitzustellen, das es eriaubt, Informa- 
tionsverarbeitung auf molekularer Basis mithilfe regularer Grammatiken vorzunehmen, ohne dabei auf eine oder wenige 
Grammatiken eingeschrankt zu sein. Das Verfahren soli kompatibel zu herkommlichen Computem sein und eine Infor- 
mationsverarbeitung erlauben, die teilweise auf molekularer Basis und teilweise auf der Basis herkommlicher Computer 35 
stattfindet. Das Verfahren soil prograrnmierbar und weitgehend automatisierbar sein. Die innerhalb des \erfahrens er- 
zeugten Polymere sollen lesbar und fur weiterfuhrende Anwendungen und \ferfahren verwendbar sein. 

Diese Aufgabe wird gelost durch ein Verfahren zur Herstellung informationstragender Polymere, das umfaBt, 

I. eine regulare Grammatik G = (E, V, R, S) mit einem endlichen Terminalalphabet £, einer endlichen Variablen- 40 
menge V, einer endlichen Regelmenge R und einem Startsymbol S zu definieren; 

n. das NFR- Verfahren (Niehaus-Feldkamp-Rauhe- Verfahren) zur Herstellung von Monomersequenzen (Oligo- 
oder Polymere); 

IH. mit dem NFR- Verfahren eine in Schritt I definierte Grammatik zu implementieren, indem damit Monomerse- 
quenzen hergestellt werden, die die Regelmenge R einer Grammatik G eindeutig darstellen; 45 

IV. aus den in Schritt IH hergestellten Monomersequenzen fur jede Regel der Regelmenge R von G ein die Regel 
) reprasentierendes Oligomer (Algomer) zusammenzusetzen (Algomer- Assemblierung); 

V. die in Schritt IV zusammengesetzten Oligomere (Algomere) zu informationstragenden Polymeren zu verknup- 
fen (Symbolpolymerisation). 

' 50 
Im Rahmen der vorliegenden Erfindung werden folgende Definitionen und Abkurzungen yerwendeL* 
Algomer: Doppelstrangiges Oligomer* das eine Regel einer gegebenen Grammatik reprasentiert. Algomere konnen mit- 
einander zu Logomeren verknupft werden. 

Auslese-PCR: PCR, die zum Auslesen der in Logomeren enthaltenen Information verwendet wird. 

Bitpolymerisation: ProzeB des Verkettens von Algomeren zu Logomeren, wenn es nur zwei verschiedene Elongatoren 55 
gibt. 

Elongaton Algomer mit zwei Uberhangsequenzeh; kann mit Terminator oder Elongator ligieren und fuhrt zu einer Ket- 
tenverlangerung. 

Grammatik: Formalismus, der Sprachen beschreibt. Er basiert auf der formalen Theorie von Sprachen [Chomsky, N., 
Three models for the description of language, JACM, 2 : 3, 113-124, (1956)], [Chomsky, N., On certain formal proper- 60 
ties of grammars, Inf. and Control, 2 : 2, 1 37-1 67, (1 959)], [Chomsky, N., Formal properties of grammars, Handbook of 
Math. Psych., 2, 323-418, (1963)]. 

Eine Grammatik G beschreibt eine Sprache L (G), das Alphabet dieser Sprache und deren Syntax. Nach einer Grammatik 
G konnen alle Worter dieser Sprache erzeugt werden. 

Eine Grammatik G ist ein Quadrupel (L, V, R, S) mit Terminalalphabet Z, Variablenmenge V, Startsymbol S und Regel- 65 
menge R. 

- Logomer Polymer, das symbolische Informationen tragt und durch die Verkettung von Algomeren erzeugt wurde. Ent- 
sprechend besteht ein Logomer aus sich wiederholenden Einheiten von Algomeren. Ein Logomer reprasentiert ein Wort 
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einer Sprache L (G), die von der entsprechenden Grammatik G erzeugt wird. 

Monomer: Einzelmolekul. Mehrere Monomere konnen zu langeren Ketten verkniipft werden und so Oligomere und Po- 
ly mere bilden. 

Monomere sind im Fall von Desoxyribonukleinsaure die Nukleotide (Adenin, Cytosin, Guanin, Thymin wie auch sog. 
5 Basenanaloga wie Hypoxanlhin etc.). 

Oligomer: Kurzkettiges Molekul aus sich wiederholenden Einheiten (Monomeren). Auch kurze doppelsirangige Mole- 
kule werden als Oligomere bezeichnet 

PGR: Polymerase Ghain Reaction = Polymerase Kettenreaktion; Verfahren zur exponentiellen Vervielfaltigung von 

10 Die PGR benougt ein DNA Template, das vervielfaltigt wird, und zwei Primer, die jeweils gegenlaufig im Template an- 

setzen und als Startpunkte einer DNA Polymerisation fungieren. Durch iterative Wiederholung von Schmelzen-Hybridi- 

sierung-Polymerisations-Zyklen wird das DNA Template vervielfaltigt. 

Polymer Langkettiges Molekul aus sich wiederholenden Einheiten (Monomeren). 

Regel: auch: Produktionsregei, Ersetzungsregel oder Ableitungsregel. 
15 Beschreibt die Ersetzung von Symbolen durch andere. Durch die wiederholte Anwendung von Regeln konnen Symbol- 

ketten erzeugt werden. 

Sequenz: Informatik: Abfolge von Zeichen; 

Ghemie: Abfolge kovalent verbundener Monomere; 

Molekul arbiologie: Abfolge kovalent verbundener Nukleotide. 
20 Komplementaritat: Zwei Sequenzen sind dann komplementar, wenn sie miteinander hybridisieren konnen. Im Faile von 

DNA sind z. B. die Sequenzen 5 , attt3* und 5*aaat3' komplementar, die Sequenz 5'acgt3* ist zu sich selbst komplementar. 

Startsymbol: Variable innerhalb einer Grammatik, von der ausgehend, durch Anwendung der Regeln der Grammatik, 

eine Symbolkette erzeugt werden kann. 

Symbolpolymerisation: ProzeB des Verkettens von Algomeren zu Logomeren. 
25 Terminal: Symbol einer Grammatik. Ein Terminal kann nicht weiter ersetzt (subsutuiert) werden. Terminale sind die 
"Buchstaben" der Worte einer Sprache L (G). 

Terminator: Algomer mit einer Uberhangsequenz. Kann nur mit Elongator ligieren. Fuhrt zum Kettenabbruch bei einer 
Symbolpolymerisation. 

Variable: Symbol einer Grammatik. Eine Variable kann gemaB der Regel einer Grammatik von Terminalen, Variablen 
30 oder Kombinationen von Terminalen und Variablen ersetzt werden. 

Kurzbeschreibung der Abbildungen 

Abb. 1: Algomere, wie in der Erlauterung zu Schritt IV des erfindungsgemaBen Verfahrens beschrieben. Die Algo- 
35 mere besitzen jeweils eine doppelstrangige Kernsequenz, die ein Terminal einer gegebenen Grammatik darstellt und 
mindestens eine einzelstrangige Uberhangsequenz, die eine Variable der gegebenen Grammatik darstellt, so daB jeweils 
ein Algomer genau eine Regel der gegebenen Grammatik reprasentiert. X und Y sind keine Miriablen, sondern tJber- 
hangsequenzen, die z. B. fur eine Klonierung benutzt werden konnen. Mit ttberstrichen dargestellte Buchstaben kenn- 
zeichnen Komplementaritat. GemaB der Definition sind AOA und A1A Elongatoren, XsA und AeY Terminatoren. Die 
40 hier dargestellten Algomere reprasentieren die im Folgenden beschriebenen Grammatik zur Erzeugung binarer Zufalls- 
zahlen. 

Abb. 2: Symbolpolymerisation, wie in der Erlauterung zura erfindungsgemaBen Schritt V beschrieben. Algomere wer- 
den durch Verkettung (im Falle von DNA: Hybridisierung und Ligation) zu Logomeren verkniipft. Das Logomer 
XsOlOlOlOl eY beinhaltet eine terminierte Bitfolge, die durch die Oberhange X und Y in einer definierten Orientierung 
45 vervielfaltigt werden kann. 

Abb. 3: Muster, das die Symbolpolymerisation fur binare Zufallszahlen nach Gelelektrophorese und Farbung zeigt 
(Spuren 1-3). Aufgrund der zufalligen Lange der binaren Zufallszahlen ergibt sich ein regelmaBiges Leitermuster. Spur 4 
zeigt einen 50 bp Molekulargewichtsstandard (Gibco BRL, Life Technologies, Katalog Nr. 10416-014). 

Abb. 4: Klonierung eines durch Symbolpolymerisation erhaltenen Logomers in einem Vektor, wie zu Vervielfaltigung 
50 und Isolierung von Logomeren im Folgenden beschrieben. 

Abb. 5: Schematische Darstellung eines Bandenmusters, das durch Auslesen eines binaren Logomers durch PGR und 
nachfolgende Gelelektrophorese erhalten wird (im Folgenden beschrieben). Im gezeigten Beispiel haben die Algomere 
eine Lange von 30 bp (Uberhangsequenzen nur V£ gerechnet). Bei bekannter Lange des Logomers reicht es, jeweils nur 
Oen oder nur len auszulesen. Beide Bits auszulesen dient der Kontroile. Das \ferfahren kann auch fur mehrwertige Lo- 
55 gomere (mehr als 2 Elongatoren) verwendet werden. 

Abb. 6: Bahdenmuster einer Gelelektrophorese nach PGR zum Auslesen von drei verschiedenen Logomeren. Die Lo- 
gomere wurden nach der im Folgenden beschriebenen Grammatik fur Zufallszahlen beliebiger Lange erhalten. Als Zu- 
fallszahlen von unten nach oben gelesen ist a = 262, b = 97, c = 329. M (Spur 5) ist ein 50 bp Molekulargewichtsstandard 
(Gibco BRL, Life Technologies, Katalog Nr. 10416-014). 
60 Abb. 7: Schematische Darstellung des Auslesens von Logomeren durch Restriktionsverdau wie im Folgenden be- 
schrieben. Die Elongatoren tragen Restriktionsschnittstellen, die derart asymmetrisch angeordnet sind, daB der Restrik- 
tionsverdau von Logomeren in einem eindeutigen Schnittmuster von Fragmenten resultiert. Das Schnittmuster entspricht 
Banden verschiedener Lange, und kann durch Gelelektrophorese sichtbar gemacht werden. Rl und R2 sind unterschied- 
liche Restrikuonsenzyme, x und y bezeichnen die Lange der nach Restriktionsverdau erhaltenen Fragmente. Zweckma- 
65 Big ist z. B. ein Verhaltnis x : y von 1:2. 

Abb* 8: Bandenmuster, die durch Gelelektrophorese nach dem Auslesen von Logomeren durch Restriktionsverdau er- 
halten werden. Spur 7 und 8 enthalten Molekulargewichtsstandards (Spur 7: 50 pb Leiter, Gibco BRL, Life Technolo- 
gies, Katalog Nr. 10416-014; Spur 8: 10 bp Leiter) 
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Abb. 9: Schematische Darstellung eines polymeren Datenspeichers auf der Basis von Algomeren und Symbolpolyme- 
risation wie im Nachfolgenden beschrieben. Algomere konnen an Ankermolekule (AM), die an einem festen Trager (Q 
gebunden ist, polymerisieren. Das Schreiben (W) erfolgt durch die wiederholte Abfolge (ReW) von Hybridisierungs-Li- 
gations-Restriktionszyklen (Hyb, Lig, Res). Durch Denaturieren oder Restriktion (Den/Dig) konnen die erhaltenen Lo- 
gomere abgetrennt und ausgelesen werden. 5 

Abb. 10: Vereinfachte Darstellung der Bestandteile eines DNA Desktop Computers wie im Nachfolgenden beschrie- 
ben. Im Einzelnen sind: 

A: Oligo-Synthesizer, B: Thermozykler, C: Reaktionskammern, D: Pipettiervorrichtung, E: Gel, 
F: Scanner, G: Steuerungscomputer 

Es kennzeichnen; 10 
1: Zugabe von Oligonukleotiden, 2: Zugabe synthetisierter Oligomere in Reaktionskammern des Thermozyklers, 3: Zug- 
abe von Losungen und Molekiilen, die zur Algomer-Assemblierung, Symbolpolymerisation, zur Isolierung von Logo- 
meren und zum Auslesen benougt werden. 

Abb. 11: Verschlusselung von Logomeren wie im Folgenden beschrieben. Sind die Terminatoren und die darin pri- 
menden Primer unbekannt, so ist das jeweilige Logomer verschlusselt und kann nicht ausgelesen werden (A). Ist dage- 15 
gen ein in einem Terminator primender Primer verfugbar oder die Sequenz eines Terminators bekannt, so kann das je- 
weilige Logomer gelesen werden (B). 

Abb. 12: Y-formiges Molekul, das als Terminator bei der asymmetrischen Verschlusselung von Logomeren verwendet 
werden kann. Elongatoren konnen an das mit 2 markierte Ende angekniipft werden, weitere, z. B. Y-formige, Molekule 
an die mit 1 und 3 bezeichneten Enden. Werden mehrere Y-formige Molekule rniteinander verkniipft, so erhalt man 20 
baumartige Strukturen. 

Abb. 13: Logomer mit Terminatoren s und e, die als baumartige Strukturen realisiert sind. 

Abb. 14: Mit einem Vektor V verkniipftes Logomer L mit baumartigen Terminatoren. Die Terminatoren sind so kon- 
struiert, daB jeweils nur ein Ast des Terminators mit dem Vektor verkniipft werden kann. 

Abb. 15: Markierung von Nukleinsauren mit Logomeren wie im Nachfolgenden beschrieben: Um gentechnisch her- 25 
gestellte oder veranderte Produkte zu markieren, wird ein Logomer mithilfe rekombinativer Techniken in einen nicht- 
transkribierten Bereich, z. B. vor den Promoter (P) eines zu markierenden .Genes (G), eingesetzt 

Abb. 16: Markierung von Dokumenten mit Logomeren wie im Nachfolgenden beschrieben. Spur 1 zeigt den verwen- 
deten Molekulargewichtsstandard (50 bp, Gibco BRL, Life Technologies, Katalog Nr. 10416-014), Spur 2 (0-Bits) und 
Spur 3 (1-Bits) das Bandenmuster des Auslesens von Logomer Nr. 330 durch PGR aus.wassriger Losung, die Spuren 4 30 
und 5 dasselbe wie die Spuren 2 und 3, wobei hierbei jedoch das Logomer Nr. 330 nicht aus wassriger Losung, sondern in 
ca. 10 9 Molekulen/ul getrocknet auf Papier (3M Post- It, 1 Stunde getrocknet) als Papierschnipsel (ca. 1 mm 2 ) in die Aus- 
lese-PCR einging. 

Abb. 17: Herstellung von Molekulargewichtsstandards durch Auslese-PGR, die ein unares Logomer als Template ent- 
halt, wie im Nachfolgenden beschrieben. 1 zeigt die Anordnung verschachtelter Primer in der Auslese-PCR, 2 das nach 35 
Gelelektrophorese der PCR-Fragmente erhaltene Bandenmuster. 

Abb. 18: Verkleben von Flachen mit Nukleinsauren wie im Nachfolgenden beschrieben. G bezeichnet die zu verkle- 
bende Flache, Log die Logomere, die zum Verkleben an die Flachen gebunden werden. 1 zeigt das Verhalten von Flachen 
mit nicht-komplementaren, 2 das Verhalten von Flachen mit komplementaren Logomeren. 

Abb. 19: Verkleben von Flachen mit Logomeren, Antikorpern und Liganden wie im Nachfolgenden beschrieben: Cq 40 
und Ci bezeichnen die zu verklebenden Flachen, die aus gleichem oder unterschiedlichem Material bestehen konnen. 
Die zu verklebenden Flachen sind mit Logomeren (Log) versetzt. An die Logomere konnen Proteine, z. B. Antikorper 
vom Typ Ab A und Ab B binden, wobei Ab A und Ab B gleich oder verschieden sein konnen. Ab A und Ab B sind ih- 
rerseits durch einen Liganden (Li) rniteinander verbunden. 

Abb. 20: Verkleben von Flachen mit Proteinen z. B. Antikorpern ohne Verwendung von Logomeren. Go und Gi be- 45 
zeichnen die zu verklebenden Flachen, die aus gleichem oder unterschiedlichem Material bestehen konnen. Die Proteine 
vom Typ Ab A und Ab B binden direkt an die zu verklebenden Flachen und sind ihrerseits durch einen Liganden (Li) rnit- 
einander verbunden. 

Erlauterung zu I ' 50 
Wahl von Grammatiken 

Eine Grammatik ist ein Quadrupel G = (£, V, R, S) mit einem endlichen Terminalalphabet Z, einer endlichen Varia- 
blenmenge V, einer endlichen Regelmenge R und einem Startsymbol S. Fur eine Sprache L (G), die durch G beschrieben 55 
wird, konnen alle Worter aus L als Worter iiber dem Terminalalphabet £ gebildet werden, indem man das Startsymbol S 
entsprechend den Regeln aus R ableitet. 

Die Definition einer Grammatik G nach Schritt I des erfindungsgemafien Verfahrens ist insofern frei, als beliebige, 
endliche Mengen von Terminalen und Variablen kodiert werden konnen. ErfindungsgemaB bevorzugt ist jedoch die De- 
finition vori Grammatiken, die die Binardarstellung von Daten gestattet, insbesondere von Grammatiken mit 60 

S: = {0, 1, sq, Si, s2, .' . Sn-i, Sn, eo, e t , e 2 , . . ., e^, e ra } mit n, m e N und n, m > 0. 

Diese ermoglichen die Herstellung binarer Logomere. 

Zur Veranschaulichung wird im Folgenden eine erfindungsgemaB definierte regulare Grammatik zur Erzeugung von 65 
Zufallszahlen beliebiger endlicher Lange in Binardarstellung gezeigt: 

Es sei eine Grammatik G = (Z, V, R, S) mit Terminalalphabet £: = {0, 1, s, e}, Variablenmenge V: = {A}, Startsymbol S 
und Regelmenge) R: = 
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{ 

S: = sA 
A — 0 A 
A-*1A 
5 A — »e 
}, 

wobei 
s: = Start 
e: = Ende 
10 sind. 

Mit dieser Grammatik konnen Worter tiber dem Terminalalphabet 
£:= (0, l,s,e} 

is gebildet werden. Alle Worter der Sprache L beginnen mit M s" und horen mit °e M auf, dazwischen beflndet sich eine zu- 
fallige Anzahl (auch 0) zufalliger Bits ("0" und "1"). Worter aus der Sprache L, die nach R gebildet werden, sind bei- 
spielsweise: 

a) S — ► sA — * se 
20 b) S— *sA-*slA — ►sle 

c) S — sA — sOA — ► sOOA — sOOlA — sOOlOA — sOOlOe 

d) S sA — si A — ► slOA — si 00 A — si 000 A — si 0000 A — si 00000 A — ► slOOOOOe 

Die als Worter der Spache L erzeugten Binarmuster konnen als beliebige jedoch eindeutige Darstellung von Datenty- 
25 pen, z. B. als Buchstaben, Zahlen, alphanumerische Zeichen oder Zeichenketten gelesen werden. Liest man sie als die 
Binardarstellung von Zahlen, so sind die qbigen Worter in Dezimaldarstellung: 

a) 0 (leer) 

b) 1 

30 c) 2 

d) 32. 

Erlauterung zu II 

35 

Das NFR-Verfahren zur Herstellung von Monomersequenzen 

Das NFR- Verfahren (Niehaus-Feldkamp-Rauhe- Verfahren) ist ein Verfahren zur Herstellung Von Monomersequenzen 
(Oligo- und Polymeren, z. B. Nukleinsauren), das gewahrleistet, daB die mithilfe des Verfahrens hergestellteh Monomer- 
40 sequenzen: 

a) eine eindeutige und einzigartige Abfolge von Monomeren haben; 

b) zueinander mogiichst unahnlich sind und daher moglichst keine Fehlhybridisierungen untereinander eingehen; 

c) bestimmte sU-ukturelle Eigenschaften aurweisen, z. B. ein bestimmtes Verhaltnis der verschiedenen Monomere 
45 zueinander, das Enthaltensein oder Nicht-Enthaltensein bestimmter Teilsequenzen und eine maximale Ubereinstim- 

mung (Homologie) untereinander; 

d) bestimmte chemische Eigenschaften aufweisen, z. B. das Vorkommen bestimmter chemisch aktiver Teilsequen- 
zen, die EinfluB auf chemische Reaktionen, im Falle von Nukleinsauren insbesondere die ^Wfechselwirkung mit Pro- 
teinen haben (Proteinbindungsstellen, Restriktionsschnittstellen, Stopcodons); 

50 ey bestimmte physikalische Eigenschaften aufweisen, z. B. eine bestimmte Schmelztemperatur. 

Das NFR- Verfahren erlaubt die Herstellung eindeutiger, moglichst unahnlicher Monomersequenzen mit vordefinier- 
baren strukturellen, chemischen und physikalischen Eigenschaften. Es eignet sich zur Herstellung von Monomersequen- 
zen fiir kontrollierte chemische Reaktionen, wie sie z. B. fur eine molekularen Informationsverarbeitung benotigt wer- 
55 den. Es wird in Schritt HI des erfindungsgemaBen Verfahrens fur die Implementierung regularer Grammatiken verwen- 
det. 

Das NFR- Verfahren ist eine erfindungsgemaBe Fortbildung des Niehaus- Verfahrens zur Erzeugung eindeutiger, mog- 
lichst unahnlicher Sequenzen, das in [Jens Niehaus, DNA Computing: Bewertung und Simulation, Diplomarbeit am 
Fachbereich Informatik der Universitat Dortmund, Lehrstuhl XI, 116-123, (1998)] beschrieben ist, und worauf hiermit 
60 in vollem Umfang Bezug genommen wird. 

Das NFR- Verfahren ist insofern eine erfindungsgemaBe Fortbildung des Niehaus- Verfahrens, als erst das NFR- Verfah- 
ren die Herstellung von Monomersequenzen erlaubt, wie sie fiir eine Herstellung in vitro, z. B. zur Implementierung von 
Grammatiken, benStigt werden. Die Griinde sind im Einzelnen: 

65 a) Das Niehaus- Verfahren beschreibt nur die Konstruktion von Sequenzen aus Basissequenzen der Lange 6. Da die 

Lange von Basissequenzen die maximal zwischen verschiedenen Monomersequenzen moglichen Oberlappungen 
beschreibt, daher unmittelbaren EinfluB auf das Hybridisierungsverhalten von Sequenzen und das Funktionieren der 
erfindungsgemaBen Schritte IV und V hat, muB das Verfahren jedoch fur Basissequenzen beliebiger Lange verall- 
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gemeinert werden, was im NFR-Verfahren vorgenommen wurde. 

b) Das Niehaus-Veifahren erlaubt nur die Erzeugung von Sequenzen gleicher Lange, wohingegen das NFR-\erfah- 
ren Sequenzen unterschiedlicher Lange und unterschiedlicher Anzahl erzeugen kann. Letzteres ist fur ein korrektes 
Hybridisierungsverhalten von Sequenzen und das Funktionieren der erfindungsgemaBen Schritte IV und V unerlaB- 
lich. 5 

c) Das Niehaus-Verfahren gewahrleistet Eindeuugkeit und maximale Unahnlichkeit von Sequenzen nur fur Se- 
quenzen, die durch eine einmalige Anwendung des Verfahrens erzeugt wurden. Zwingend erforderlich ist jedoch, 
auch zu schon existierenden Sequenzen jeweils kompaiible, d. h. eindeutige und maximal unahnliche Sequenzen er- 
zeugen zu konnen. Das NFR-Verfahren kann im Gegensatz zum Niehaus-Verfahren zu beliebig vorgegebenen Se- 
quenzen kompatible (d. h. eindeutige und maximal unahnliche) neue Sequenzen erzeugen. Dabei kann das \ferfah- 10 
ren beliebig oft auf dieselbe Menge von Sequenzen angewendet werden. 

d) Das Niehaus-Verfahren beschrankt zwar die maximale Lange gemeinsamer Teilsequenzen, jedoch nicht deren 
Anzahl. Daher konnen 2 beliebige nach dem' Niehaus-Verfahren konstruierte Sequenzen mehrere gemeinsame Teil- 
sequenzen beinhalten, was ungewollt zu einer hohen Homologie (Sequenzubereinstimmung) fiihren kann. Die Ho- 
molgie hat ihrerseits unmittelbaren EinfluB auf das Hybridisierungsverhalten von Sequenzen und das Funktionieren 15 
der erfindungsgemaBen Schritte IV und V. Das NFR-Verfahren dagejgen fuhrt bei der Konstruktion von Sequenzen 
auch einen Homologievergleich durch und vermeidet dadurch ungewollte Fehlhybridisierungen. 

e) Das Niehaus-Verfahren erlaubt nicht die Integration bestimmter, vorgebbarer Sequenzen und Teilsequenzen. 
Solche Sequenzen sind jedoch fur die Ausfiihrung und Kontrolle bestimmter chemischer Reaktionen, z. B. kontrol- 
lierter enzymatischer Wechselwirkungen, zwingend notwendig. Beispiele fur solche Sequenzen sind im Falle von 20 
Nukleinsauren Proteinbindungsstellen, Restriktionsschnittstellen und Stopcodons. Dagegen erlaubt das NFR-\fer- 
fahren die Integration beliebiger Sequenzen und Teilsequenzen in die Herstellung von Monomersequenzen und ge- 
wahrleistet gleichzeitig Eindeutigkeit und maximale Unahnlichkeit. 

f) Das Niehaus-Verfahren sieht keine Moglichkeit vor, Sequenzen mit bestimmten strukturellen, chemischen oder 
physikalischen Eigenschaften zu erzeugen. Dagegen enthalt das NFR-Verfahren die Moglichkeit, Sequenzen mit 25 
bestimmten strukturellen, chemischen und physikalischen Eigenschaften herzustellen. Dazu zahlen u. a. das Ver- 
haltnis verschiedener Monomere zueinander und die Schmelztemperatur. Auch dies ist fur die Implementierung von 
Grammatiken in vitro eine unbedingte Voraussetzung. 

g) Das Niehaus-Verfahren erlaubt keine direkte Erzeugung regelreprasentiererider Sequenzen, wie sie zur Imple- 
mentierung von Grammatiken benotigt werden. Dagegen ermoglicht das NFR-Verfahren die Erzeugung symbolre- 30 
prasentierender Sequenzen, die zu den fur die implementierung einer Grammatik benotigten regelreprasentierenden 
Sequenzen verkniipft werden konnen. 

h) Nur mithilfe des NFR- Verfahrens konnen Sequenzen auch so konstruiert werden, daB die Eigenschaften der Ein- 
deutigkeit, maximalen Unahnlichkeit sowie struktureUe, chemische und physikalische Eigenschaften auch fur Teil- 
sequenzen gelten. Z. B. lassen sich im Falle von Nukleinsauren Monomersequenzen so herstellen, daB sowohl die 35 
Gesamtsequenz, als auch z. B. das erste Drittel der Sequenz einen 50%igen GC-Anteil haben. Diese Eigenschaft ist 

z. B. fur das Funktionieren der Verkettung von Sequenzen, die pro Molekul fur mehrere Hybridisierungsereignisse 
vorgesehen sind (wie z. B. die im Folgenden beschriebenen Algomere), eine unbedingte Voraussetzung. Nur so las- 
sen sich z. B. Sequenzen so konstruieren, daB unterschiedliche Hybridisierungsereignisse pro Molekul gleichwahr- 
scheinlich sind. 40 

i) Nur das NFR-Verfahren erlaubt die unmitteibare, automatische Herstellung von Monomersequenzen, z. B. duch 
einen Oligonukleotidsynthesizer. 

Zur Herstellung von Monomersequenzen werden diese durch das NFR-Verfahren konstruiert und synthetisiert. Zur 
Herstellung von n Monomersequenzen wird das NFR-Verfahren, wie im Folgenden beschfieben, durchgefuhrt, wobei 45 
zur Beschreibung des Verfahrens folgende Abkurzungen benutzt werden: 
A: = Alphabet der Machtigkeit a e N; 
Im Falle von DNA ist A: = {a, c, g, t} und a = 4. 
Si'. = Sequenz. 1 

Folge von Elementen des Alphabets A, das einer Sequenz aus Monomeren entspricht. 50 
Isc q : = Lange der pro Verfahrenszyklus zu konstruierenden Sequenzen. 
Sscq* = Sequenz der Lange I^q. 

Sscq.k* = (k-l)-tes Monomer der Sequenz Sscq (k e N k < = Iseq). 

Ibasi = Lange der pro Verfahrenszyklus zur Konstruktion von Sequenzen verwendeten Basissequenzen. 

ES gilt: 0 < I bas < = Iseq. 55 

Sbas- ~ Sequenz der Lange Basissequenz; Sequenzen der Lange Is^ werden aus Basissequenzen konstruiert. 
Io V : = maximale Lange der Kette aufeinanderfolgender Monomere, die jeweils zwei durch das \ferfahren erzeugte Se- 
quenzen gemeinsam haben ("overlap"). 

Ibas-1- 

Jov^scq — Verhaltnis von maximal erlaubter Sequenzwiederholiing zu Sequenzgesamtlange; 60 

1 . MaB fur die Fehlhybridisierungswahrscheinlichkeit. 

Ibas^seq = Verhaltnis von Basissequenzlange zu Sequenzgesamtlange; 

2. MaB fur die FehmybridUsierungswahrscheinlichkeit. 
Mseqi = Menge von Sequenzen. 

Mbas: = Menge aller Basissequenzen der Lange Ibas- 65 
Mnobas: = Teilmenge der Menge von Basissequenzen der Lange Ibas, die durch Dekomposition aus M^ erhalten wiird. 
IMnobas^* = Machtigkeit von M^bas = Anzahl der Basissequenzen in M aobas . 
n: = Anzahl pro Verfahrenszyklus zu konstruierender Sequenzen. 
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n tol : = Anzahl insgesamt in alien Verfahrernszyklen hergestellter Sequenzen. 
n max : = maximale Anzahl pro Verfahrenszyklus konstruierbarer Sequenzen. 
h: = Homologie. Ein Ma6 fiir die Ubereinstimmung zwischen zwei Sequenzen. 
Esgilt:0< = h<= 1. 

5 t m : = Schmelztemperatur. Fiir eine DNA-Sequenz wird die Schmelztemperatur nach dem Nearest Neighbour Verfahren 
(siehe Breslaucr, K. J., Frank, R., Blocker, H., Marky, L. A., Proc. Natl. Acad. Sci., 83, 3746-3750, 1989) bestirnmt: 
t ra = AH / (AS + R x In(C/4)) - 273,15°C 

Dabei sind AH und AS Enthalpie und Entropie der DNA-Heiix, R die molare Gaskonstante und C die Konzentraition der 
DNA-Sequenz. 

10 Das Herstellungverfahren erfolgt als ein Abfolge beliebig, jedoch endlich vieler Verfahrensryklen, in denen n tot Se- 
quenzen konstruiert werden, und einer nachfolgendeij Synthese, in der alle Sequenzen in vitro erzeugt werden. 

Die maximale Anzahl n max der pro Verfahrenszyklus kdnstruierbaren Sequenzen errechnet sich entsprechend den oben 
gegebenen Definitionen nach 

15 n ra „ = /(a, I 5as , 1^): = L (»/ 2 • ((a 1 ^ - (a Ibas/2 - IM^^OVOU, - Io V )_l. 

D. h. es lassen sich maximal n^ Sequenzen der Lange I^q aus Elementen eines Alphabetes A der GroBe a (im Falle 
von DNA ist a> 4) konstruieren, die in maximal ^ zusammenhangenden Ketten von Monomeren ubereinstimmen. Die 
Anzahl der tatsachlich pro Verfahrenszyklus erhaltenen Sequenzen kann geringer sein, wenn diese bestimmte physikali- 
20 sche, chemische oder strukturelle Eigenschaften aufweisen sollen, oder wenn zusatzlich zu bereits vorhandenen Sequen- 
zen weitere Sequenzen hergestellt werden. 

Im Einzelnen sind folgende Verfahrensschritte notig: 

1 . Es werden n tot Sequenzen in z Verfahrenszyklen konstruiert und in einer Menge Ms Cq gesammelt. Man beginnt 
25 mit der leeren Sequenzmenge M^. 

2. Zur Sequenzmenge konnen einmalig, vor Beginn des Verfahrenszyklus, beliebige, jedoch eindeutige, Se- 
quenzen hinzugefugt werden. Dies kann nutzlich sein, um bestimmte Sequenzen hinzuzufugen, die aus Grunden der 
weiteren Anwendung in der Menge der hergestellten Monomersequenzen enthalten sein sollen. Es empflehlt sich 
dabei, nicht zu viele und nicht zu lange Sequenzen hinzuzufugen, da das Verfahren fur diese Sequenzen nicht die- 

30 selben Eigenschatten garantiert wie fiir die im Folgenden konstruierten Sequenzen. 

3. Beginn des Verfahrenszyklus: Es werden die strukturellen, chemischen und physikalischen Eigenschaften fest- 
gelegt, die die herzustellenden Sequenzen erfullen miissen. Strukturelle Eigenschaften sind zumindest das Erithal- 
tensein oder Nicht- Enthaltensein bestimmter Teilsequenzen (ggfs. auch die Positionen, an denen die Teilsequenzen 
in den zu erzeugenden Sequenzen enthalten oder nicht enthalten sein sollen) und das Vferhaltnis der Anzahl der ver- 

35 schiedenen Monomere zueinander (im Falle von DNA: Verhaltnis GC/AT). Chemische Eigenschaften sind minde- 

stens das Vorkommen bestimmter Teilsequenzen, die EinfluB auf die chemische Wechselwirkung mit eigenen oder 
anderen Substanzen haben (im Falle von DNA z. B. bestimmte Proteinbindungsstellen, Restriktionsschnittstellen 
wie z. B. 5*gatatc3* fur EcoRV, die Stopcodons 5'tca3\ 5'tta3', 5'cta3' usw.). Zu den festzulegenden physikalischen 
Eigenschaften zahlt zumindest die Schmelztemperatur t m der herzustellenden Sequenzen. 

40 4. Es werden jetzt die Anzahl der pro Zyklus gewunschten Sequenzen n < = nach obiger Formel I^q der zu 

konstruierenden Sequenzen und Ibas der zur Konstruktion benotigten Basissequenzen festgelegt. teq und Ibas werden 
nach der oben angegebenen Formel so gewahlt, daB die gewiinschte Anzahl n zu konstruierender Sequenzen er- 
reicht werden kann. Da ha&fiseq proportional zur Fehlhybridisierungswahrscheinlichkeit ist, werden Ibas und so 
gewahlt, daB das Verhaltnis IbaAeq moglichst gering ist (Werte unter 0,3 sind empfehlenswert) und Werte fur 1^ 

45 gute Hybridisierungsbedingungen garantieren. Fiir DNA sind temperaturabhangig beliebige Werte fur 1^ > 0 mog- 

lich. 

5. Es wird die Menge M bas aller Sequenzen des Alphabetes A der Lanee Ibas erzeugt. Die solcherart erzeugten Se- 
quenzen werden als Basissequenzen bezeichnet. Es gibt dabei immer a" 33 * Basissequenzen. Diese Basissequenzen. 
dienen der Konstruktion der herzustellenden Sequenzen. Jede Basissequenz bekommt einen Status "benutzt" oder 

50 "unbenutzt" zugewiesen. Es werden zunachst alle als unbenutzt markiert. 

6. Selbst-komplementare Basissequenzen aus Mbas werden nun als benutzt markiert. Dabei gibt es genau a Ibas/2 zu 
sich selbst komplementare Basissequenzen. 

7. Sollten bereits Sequenzen in der Menge Mscq vorhanden sein, so konnen entweder dazu kompatible neue Se- 
quenzen konstruiert werden oder die Sequenzen einer Teilmenge von Mgeq kompatibel verlangert wenden. Dazu 

55 wird innerhalb eines Dekompositionsverfahrens aus den bereits vorhandenen Sequenzen aus Mseq eine Menge Mno- 

bas aUer Teilsequenzen der in Schritt 4 vorgegebenen Lange Ibas der Sequenzen aus Mscq gebildet: 
SetZC Mnobas = {)• 

Jede Sequenz S scq aus M^ wird nun in (1^ - Iqv) Dekompositionsschritten zerlegt: 
Beginne mit i = 0 mit dem Dekompositionsschritt: 
60 Solange i < (Iseq - Io V ): 

Bilde als neue Sequenz Sne U als Sequenz der Lange Ibas bestehend aus den Monomeren Ssegi bis Sgeq^+ibas- S neu : = 
Sscq,u • • •» Sscq.i+ibas- Fuge S neu der Menge M nob as hinzu. 
Setzei: = i + 1. 

Die auf diese Weise erhaltene Menge M Dobas ist defimtionsgemaB eine Teilmenge von Mbas- 
65 8. Alle Basissequenzen der Menge Mbas, die auch in M no bas vorkommen, werden als benutzt markiert, so daB fur die 

Konstruktion von Sequenzen genau (a**** - a Ibas/2 - IM nobas l) unbenutzte Basissequenzen ubrig bleiben, aus denen 
nun maximal 
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verschiedene neue Sequenzen konstruiert werden konnen, die untereinander und zu den bereits vorhandenen Se- 
quenzen keine Basissequenzen bzw. deren Komplemente gemeinsam haben. 10 

9. Aus den Basissequenzen wird ein gerichteter Graph konstruiert, dessen Knoten bestimmte Basissequenzen re- 
prasentieren: Der Graph enthalt genau a 115 * 3 Knoten, von denen bereits (o a>as/2 + [M no basD Knoten als benutzt markiert 
sind. Jeder Knoten ist mit einer Basissequenz S b (i> assoziiert, die nicht zu sich selbst komplementar ist (im weiteren 
wird es keine Unterscheidung von Knoten und assoziierter Basissequenz geben). Es existiert eine Kante von Sb(i) 
nach Sb(ic), wenn die Io V letzten Buchstaben von den Io V ersten Buchstaben von Sbflo entsprechen, wenn also gilt: 15 
Sb(i),2» • • •> Sb<i),ibas = Sb(ic),i, . • •> Sb(k).ibas-i- Der Knoten Sb-(k) wird Nachfolgeknoten von Sb(i) genannt. Der Kno- 
ten, der mit dem Komplement der Basissequenz assoziiert ist, die durch den Knoten Sb(i) kodiert wird, wird Kom- 
plementknoten zu Knoten Sb(i) genannt Sequenzen der Lange 1^ werden gefunden, indem ein Pfad mit (I^q - I ov ) 
Knoten gesucht wird. Jeder Knoten darf maximal einmal benutzt werden. AuBerdem darf fur jeden Knoten, der in 
einem der Pfade liegt, der Komplementknoten in keinem Pfad vorkommen. Der Anfangsknoten des Pfades tragt wie 20 
die Sequenz einen Status "benutzt" bzw. "unbenutzt". 

10. Aus dem Graphen konstruiert man Sequenzen nach folgendem Verfahren: 

Kennzeichne alle unbenutzten Knoten des Graphen als unbenutzte Anfangsknoten. Fur jedes s zwischen 1 und n: 
Solange Knoten Sb(k) existiert, der noch nicht als benutzter Anfangsknoten markiert ist: 

Wahle einen unbenutzten Knoten aus. 25 
Markiere Knoten S b ck) a * s benutzten Anfangsknoten; auBerdem: 
Markiere Sequenz Sb(k) und sein Komplement als benutzt. 

Nun wird eine neue Sequenz S ncu konstruiert, die neues Element fur M^ ist oder eine bestehenden Sequenz S sub aus 
verlangert: 

Setze S ncu ,o: = S b (k),i. 30 
Falls sie als neue Sequenz konstruiert wird, setze i: = 0. 

Falls sie als Verlangerung einer bereits bestehenden Sequenz S^ konstruiert wird, setze i: = L^. 
Solange i < I seq - (Io V -l) und i > = 0 gilt: 

Existiert kein unbenutzter Nachfolgeknoten Sb(m) von Knoten Sb(i>, so markiere Knoten Sb(k) und dessen Komple- 
mentknoten als unbenutzt und setze i: = i-1. 35 
Sonst wahle per Zufall einen unbenutzten Nachfolgeknoten Sb( m > von Knoten Sbno aus unc * markiere b m un< * lessen 
Komplementknoten als benutzt. Setze zusatzlich: i: = i+1, k: = m, Snca,i -= Sb(m),i- 

Wenn i = - (I<, v -1) ist, ist die Sequenz Sn CU fertig: sie besteht aus den Buchstaben S neu ,o D * s Sneu,(iseq - iov). 

11. Zu jeder der in Schritt 10 erhaltenen Sequenzen werden die jeweiligen strukturellen, chemischen und physika- 
lischen Eigenschaften im Vergleich zu den in Schritt 3 festgelegten Bedingungen ermittelt. Geniigt die jeweilige Se- 40 
quenz nicht den vorgegebeneri Bedingungen, so wird sie geloscht und die von ihr benutzten Knoten und Komple- 
mentknoten wieder als unbenutzt markiert. 

12. Wenn die Anzahi der konstruierten Sequenzen nicht ausreicht, kann der Verfahrenszyklus von Schritt 3 oder 4 
an beliebig oft wiederholt werden. Insbesondere ist es moglich, die strukturellen, chemischen und physikalischen 
Kriterien und die Werte fur n, 1^, Ibas pro Verfahrenszyklus jeweils neu zu setzen. So ist es moglich, Sequenzen mit 45 
unterschiedlichen strukturellen, chemischen und physikalischen Eigenschaften, sowie unterschiedlicher Lange zu 
konstruieren, die trotzdem kompatibel, also eindeutig und maximal unahnlich sind. Ansonsten geht man zum nach- 
sten Schritt, der in vitro Synthese. 

13. Die konstruierten Sequenzen werden in vitro, im Falle von Nukleinsauren vorzugsweise mittels eines Oligonu- 
kleotidsynthezisers (z. B. ABI 392, ABI 398, ABI 3948 von Perkin-Elmer Applied Biosystems), synthetisiert. Dazu 50 
werden die Sequenzdaten der Steuerungseinheit des Oligonukleotidsynthesizers ubermittelt und die Sequenzen als 
einzelstrangige Nukleinsauren hergestellt. Die Sequenzen konnen auch kommerziell bestellt werden. ZweckmaBig 
sind PAGE-gereinigte Oligonukleotide (z. B. von ARK Scientific GmbH Biosystems, 64293 Darmstadt, erhaltlich). 

55 

Erlauterung zu III 
Implementierung regularer Grammatiken mit dem NFR- Verfahren 

Die Herstellung von Monomersequenzen zur Darstellung der Regelmenge von Grammatiken in Schritt HI des erfin- 60 
dungsgemafien Verfahrens erfoigt mit Hilfe des NFR-Verfahrens (Niehaus-Feldkamp-Rauhe- Verfahren) nach Schritt II 
des erfindungsgemaBen Verfahrens. Zur Implementierung von Grammatiken werden nach dem NFR- Verfahren fur r Re- 
geln einer Grammatik G genau 2r Monomersequenzen hergestellt, so daB die Monomersequenzen fur die s dargestellten 
Symbole (Terminale und Variaiblen) und die Regeln R der Grammatik G eindeutig und • zueinander moglichst unahn- 
lich sind, sowie die geforderten strukturellen, chemischen und physikalischen Eigenschaften aufweisen. 65 

Die Monomersequenzen werden dazu nach dem INFR- Verfahren so hergestellt, daB sie wie im Folgenden beschrieben 
zu Algomeren zusammengesetzt werden konnen. Es werden dabei jeweils 2 Monomersequenzen zu einem Algomer zu- 
sammengesetzt, das genau eine Regel R einer Grammatik G reprasenuert. Dabei enthalten beide Monomersequenzen je- 
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weils Sequenzen, die die nach der Regel R erforderlichen zusarnmengehorenden Symbole (Terminale oder Variablen) 
enthalten. 

Der Entwurf der Oligomere nach Schritt III des erfindungsgemaBen Verfahrens ist abhangig von der chemischen Natur 
der eingesetzten Monomere. Im bevorzugten Fall der aus Nukleotiden aufgebauten Oligomere wird folgendermaBen vor- 
5 gegangen: 

Algomerc sind doppelstrangig und haben cinen 5"-Strang (Oberstrang) und einen 3-Strang (Unterstrang). Oberstrang 
und Unterstrang konnen die Verknupfung jeweils einer Terminal- und einer Variablensequenz sein. 

Es seien X, Z beliebige Variablen, S eine Variable, die als Startsymbol fungiert, y, z beliebige Terminalsymbole. Dann 
wird fur jede Regel der Form: 

10 

a) S: = yX ein Algomer konstruiert, das eine eindeutige doppelstrangige Kernsequenz y enthalt, an die am 3'-Ende 
eine eindeutige einzelstrangige Uberhangsequenz X angehangt ist; =" bedeutet in diesemFall, da8 S und yX iden- 
tisch sind, d. h. yX als Startermolekiil fungiert. 

b) X — ► yZ ein Algomer konstruiert, das eine eindeutige doppelstrangige Kernsequenz y enthalt, an die am 5'Ende 
15 eine eindeutige einzelstrangige Uberhangsequenz X und am 3-Ende eine eindeutige einzelstrangige Uberhangse- 
quenz Z angehangt ist. X kann dabei identisch mi t Z sein. 

c) X — * z ein Algomer konstruiert, das eine eindeutige doppelstrangige Kernsequenz z enthalt, an die am 5-Ende 
eine eindeutige einzelstrangige Uberhangsequenz X angehangt ist. 

20 Algomere der Form S: = yX und X — ► z heiBen Terminaforen ("Start", "Ende"), da sie zum Kettenabbruch wahrend der 
Polymerisation im erfindungsgemaBen Verknupfungsschritt V fuhren, der im Folgenden beschrieben wird; Algomere der 
Form X — + yZ heiBen Elongatoren, weil sie zu einer Kettenverlangerung wahrend der Polymerisation im erfindungsge- 
maBen Verknupfungsschritt V fuhren. 

Vorzugsweise umfassen die in den Schritten II und IQ des erfindungsgemaBen Verfahrens hergestellten Monomerse- 

25 quenzen Nukleotide, insbesondere Ribonukleoude, besonders bevorzugt Desoxyribbnukleotide. Die in Schritt II des er- 
findungsgemaBen Verfahrens konstruierten Monomersequenzen konnen vorteillhafterweise besurnmte Sequenzen, z.B. 
Stopcodons, Erkennungssequenzen fur Nukleinsauren spaltende Enzyme (Restriktionsnukleasen), Erkennungssequen- 
zen fur Nukleinsaure-bindende Proteine u. a. enthalten, wie sie beispielsweise in [J. Sambrook, E. F. Fritsch, T. Maniatis, 
Molecular Cloning, A Laboratory Manual, (1989)], [Rolf Knippers, Molekulare Genetik, Georg Thieme Verlag; (1997)] 

30 und [Benjamin Lewin, Genes V, Oxford University Press, (1994)] beschrieben werden. 

Erlauterung zu IV 
Algomer-Assemblierung 

35 

Das Assemblieren der in Schritt HI synthetisierten Sequenzen erfolgt in Schritt IV des erfindungsgemaBen Verfahrens. 
Im Rahmen der vorliegenden Erfindung sind zur Durchfuhrung des Schrittes IV alle dem Fachmann bekannten Techni- 
ken, Oligomersequenzen zusammenzusetzen, einsetzbar. Im erfindungsgemaB bevorzugten Fall des Einsatzes von Nu- 
kleotidsequenzen ist es zweckmaBig folgendermaBen vorzugehen: 

40 

a) Die zu Elongatoren gehorenden einzelstrangigen Sequenzen werden phosphoryliert. Dazu sind verschiedene 
dem Fachmann bekannte Protokolle mogUch, z. B. das Folgende: 

In einem 20 ul Ansatz werden 16 ul einer synthetisierten 100 uM Sequenz, 2 ul ligationspuffer (z. B. 50 mM Iris- 
HC1 pH 7.5, 10 mM MgCl 2 , 10 mM Dithiothreitol, 1 mM ATP, 25 ug/ml BSA Bovine Serum Albumin, New Eng- 
45 land Biolabs) und 2 ul PNK (Polynukleotidkinase, z. B. von New England Biolabs, Katalognr. #201 S oder #201 L) 

1 Stunde bei 37°C inkubiert Volumina, Inkubationszeit und -temperatur konnen in dem Fachmann bekannter Weise 
variiert werden. 

b) Jeweils in einem Ansatz werden die zu einem Algomer gehorenden Einzelstrange (Ober- und Unterstrang) zu ei- 
nem fertigen Algomer hybridisiert. Fur Elongatoren konnen einfach die Phosphorylferungsansatze von Ober- und 

50 Unilerstrang verwendet werden. Fur die Hybridisierung sind mehrere Protokolle moglich; bevorzugt ist ein Dena- 

turierungsschrift bei etwa 95°C zu Anfang (dieser deakUviert gleiclhzeitig die PNK in den Ansatzen der Elongato- 
ren) und einelangsame Hybridisierung. Z. B. kann fur Oligomere der Lange 30 folgendes Protokoll verwendet wer- 
den, das gemaB den Kenntnissen des Fachmanns variiert werden kann: 

In einem 40 ul Ansatz werden jeweils 20 ul des Oberstranges (100 uM) und 20 ul des Unterstranges ( 100 uM) in ei- 
55 nem Thermozy kler 5 Minuten auf 95°G erhitzu 5 Minuten auf 72°C inkubiert und dann 25 Minuten jeweils 1 °C pro 

Minute abgekuhlt. 

Erlauterung zu V 

60 

Herstellung von Lxjgomeren durch Verkettung von Algomeren 
Symbolpolymerisation 

65 In Schritt V des erfindungsgemaBen Verfahrens werden die Algomere zu langerkettigen, informationstragenden Poly- 
meren (Logomeren) verkniipft Da Algomere die Regelmenge R einer Grammatik G darstellen, entsprechen alle dabei 
erzeugten Logomere Wortern der Sprache L(G), die durch die Grammatik G beschrieben wird. 

Der geregelte ProzeB der Verkettung von Algomeren zu Logomeren wird als M Symbolpolymerisation" bezeichnet, im 
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Falle, daB die Terminalsymbole Bits reprasentieren, das heiBt, im Falle, daB gilt: 
S: = {0, 1, s 0 , S!, s2, . . .,vi> s n , eo, e w e2, . . .,e m .!, e m } mit n,m 6eN und n, m > 0 

wird der ProzeB als "Bitpolymerisauon" bezeichnet. * 5 

Im Rahmen der vorliegenden Erfindung sind zur Durchfuhrung des Schrittes V alle dem Fachmann bekannten Tech- 
niken, Oligomere zu Polymeren zu verknupfen, einsetzbar. Im erfindungsgernaB bevorzugten Fall des Einsatzes von Oli- 
gonukleotiden ist es zweckmaBig, die zu verkniipfenden Algomere in Gegenwart von Ligase zu inkubieren. Bei spiels- 
weise kann nach folgendem Protokoll vorgegangen werden, das gemaB den Kenntnissen des Fachmanns variiert werden 
kann: io 
In einem 27 pi Ansatz werden 1 pi 50 pM "Start"- Algomer, 1 pi 50 pM "Ende" -Algomer und 2x jeweils 10 pi 40 uM 
Elongator- Algomere (aus Schritt IV des erfindungsgemaBen Verfahrens erhalten), 1,5 pi lOmM rATP und 3,5 pi T4 
DNA Ligase mit 400 NEB Units/pl (z. B. Katalognr. #202S und #202L NEB) zwischen 4°C und 25°C fiir 2 bis 24 Stun- 
den inkubiert. Andere Reaktionsvolumina funktionieren analog. Inkubationszeit und -temperatur konnen in dem Fach- 
mann bekannter Weise variiert werden. 15 
Abb* 3 zeigt das Resultat einer solchen Symbolpolymerisation. 

Es konnen dabei grundsatzlich beliebig viele Algomere, die keine Terminatoren sind, verknupft werden. Der Polyme- 
risationsvorgang kommt fur jedes einzelne Logomer dann zu einem Stillstand, wenn das entsprechende Molekiil an sei- 
nen Enden jeweils ein Algomer tragt, das als Terminatormolekul ("Start", "Ende") fungiert. 

■ 20 
Vereinzelung und Vervielfaltigung von Logomeren durch Klonierung 

Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Verfahren zur Isolierung und Vervielfaltigung von infor- 
mationstragenden Polymeren, die nach einem der vorhergehenden Anspriiche erhalten wiirden, das dadurch gekenn- 
zeichnet ist, daB man in Schritt V erhaltene informationstragende Poly mere in Klonierungsvektoren ligiert, kompetente 25 
Zellen mit diesen Vektoren transformiert und die erfolgreich transformierten Bakterien anhand von Selektionsmarkem 
selektioniert. 

Die aus Schritt V des oben beschriebenen erfindungsgemaBen Verfahrens (Symbolpolymerisation) erhaltenen Logo- 
mere konnen zum Zwecke der Vereinzelung und Vervielfaltigung kloniert werden. 

Dazu wird der verwendete Klonierungsvektor mit Restriktionsenzymen aufgeschnitten und ein Logomer hineinligiert. 30 
Das Verfahren stellt sicher, daB nur fertig polymerisierte (mit Terminatoren versehene) Logomere mit dem Zielvektor li- 
giert werden konnen. Korrekt in den Zielvektor ligierte Logomere bilden ein wieder ringformiges Molekul. Die Verein- 
zelung yon Logomeren erfolgt durch die Transformation von Bakterien mit dem Molekulgemisch, das das Resultat der 
Ligation ist. Die Vektoren tragen Selektionsmarker (vorzugs weise Antibiotika-Resistenz z. B. Ampicillin-Resistenz), 
mit denen erfolgreich transformierte Bakterien ausgewahlt werden konnen. Da jedes Bakterium nur ein Plasmid expri- 35 
miert, ist jedes erfolgreich transformierte Bakterium TVager genau eines Logomers. Solcherart klonierte Logomere kon- 
nen dann zur weiteren Verwendung einfach und in groBen Mengen (auf Fest- oder in Russigmedium, Fermentem) ver- 
vielfaltigt werden. 

Die aus Schritt V des erfindungsgemaBen Verfalhrens erhaltenen Logomere werden zum Zwecke der Vereinzelung 
und Vervielfaltigung in einem beliebigen Klonierungsvektor (Plasmid) kloniert, der Restriktionsschnittstellen tragt, die 40 
zu den Sequenziiberhangen der Terminatoren der Logomere kompatibel sind (z. B. HinaTH, BamHI Erkennungssequen- 
zen im Klonierungsvektor pBluescript II KS +/- Stratagene, Katalog Nr. #212207). Die Klonierung erfolgt nach ubli- 
chen Laborprotokollen, wie z. B. in [J. Sambrook, E. R Fritsch, T. Maniatis, Molecular Cloning, A Laboratory Manual, 
(1989)] beschrieben. Z. B. kann folgendes Protokoll verwendet werden, das gemaB den Kenntnissen des Fachmanns va- 
riiert werden kann: 45 

a) Restriktion und Preparation des Klonierungsvektors 

Zur Klonierung konnen beliebige Klonierungsvektoren verwendet werden, wie sie fiir molekularbiologische Aferfah- 
ren ublich sind. (Geeignet ist z; B. das Plasmid pBluescript II KS +/-, Stratagene, Katalog Nr. #212207). Das Plasmid 50 
wird einem Restriktionsverdau mit zwei Restriktionsenzymen unterworfen, die Uberhange erzeugen, die zu den Termi- 
natoren der Logomere kompatibel sind. Als Restriktionsenzyme konnen z. B. BamHI und Hindlll (z. B. von NEB, New 
England Biolabs, Katalog Nr.: #136S und #104S) verwendet werden. Dazu kann ein ubliches Restriktionsprotokoll ver- 
wendet werden, das gemaB den Kenntnissen des Fachmanns variiert werden kann, z. B. das Folgende: 

In einem 50 ul Ansatz werden 30 pi Plasmid (0,7 pg/pl), 5 pi lOx Puffer (z. B. NEB2, New England Biolabs), 5 pi 55 
BamHI (100 units), 5 pi Hindm (100 units) und Spl BSA lOx fur 1-2 Stunden bei 37°C inkubiert. Zur Kontrolle wird 
1 pi des Ansatzes, sowie eine entsprechende Menge ungeschnittenes Plasmid auf einem 1% Agarose Gel (z.B. Ultra- 
Pure™ von Gibco BRL, Life Technologies, Katalog Nr.: 15510-4)27) elektrophoretisch aufgetrennt. Zur Praparation der 
DNA wird der Restriktionsansatz phenolisiert, die DNA gefallt und wiederaufgenommen: 

60 

- Ansatz auf 200 pi mit Aqua dest. auffullen 

- 200 ul Phenol zugeben, vortexen, bei 10000 g 3 Minuten zentrifugieren 

- Uberstand aufhehmen und 200 pi Chloroform zugeben, vortexen, bei 10000 g 3 Minuten zentrifugieren 

- Uberstand aufhehmen, mit 1/10 Vol. 3M NaAc ansauern und mit 2J5x Volumen 100% EtOH versetzen, vortexen, 

fur mindestens 15 Minuten auf -70°C - 65 

- mindestens 15 Minuten auf 10000 g zentrifugieren, Uberstand abnehmen und verwerfen 

- mit ca. 500 pi 70% EtOH waschen, fur 5-10 Minuten auf 10000 g zentrifugieren, Uberstand abnehmen und ver- 
werfen 
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- Pellet trocknen und in Aqua dest. wiederaufnehmen, so daB das geschnittene Plasmid mil 100 ng/ul bis 1 ug/pl 
vorliegt (hohere Konzenlrationen sind auch moglich). Plasmid kann fur weitere Ligationen notigenfalls verdunnt 
werden. 

5 

b) Ligation des Logomers in den Klonicrungsvektor 

Die in Schritt V des erfindungsgemaBen verfahrens erhaltenen Logomere und die praparierten Klonierungsvektoren 
werden ligiert. Durch die Art und Weise der Preparation ist gewahrleistet, daB moglichst nur die gewiinschten Ligationen 

10 stattfinden: Die Terminatoren der Logomere tragen zwei verschiedene Uberhangsequenzen, die zu den durch Restriktion 
entstandenen Uberhangsequenzen des Klonierungsvektors kompatibel sind. Dadurch konnen die Logomere nur in einer 
definierten Richtung in clen Klonierungsvektor ligieren. AuBerdem sind die Terminatoren der Logomere nicht phospho- 
ryliert, weshalb Logomere ausschlieBlich mit den Uberhangsequenzen des Klonierungsvektors ligieren konnen. Die Li- 
gation erfolgt nach einem iiblichen Ligationsprotokoll wie z. B. in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular 

15 Cloning, A Laboratory Manual, (1 989)] beschrieben, das gemaB den Kenntnissen des Fachmanns variiert werden kann, 
beispielsweise wie folgt: 

Das molare Verhaltnis Logomere/Klonierungsvektor kann z. B. 500 betragen, in 10 pi Gesamtvolumen werden: 

1 pi Plasmid (10 ng/pl = 5 nM) 
20 0,5 pi 4 uM Logomere aus Schritt V des erfindungsgemaBen Verfahrens 
1 pi lOxLigationspuffer 
0,5 pi T4 DNA Ligase (400 u/pl) 
7 pi H 2 0 

25 fur 12 Stunden auf 16°C ligiert. 

Das Protokoll kann gemaB den Kenntnissen des Fachmanns variiert werden. Z. B. ist es moglich, ein Protokoll zur 
TCL (Temperature Cycle Ligation, [Lund, A. H., Duch, M., Pedersen, F. S. Increased cloning efficency by temperature- 
cycle ligation, Nucleic Acids Research, 24: (4), 800-801, (1996)]) zu verwenden. 

Der erhaltene Ligationsansatz wird nun fur die Transformation kompetenter Zellen verwendet, wie nachfolgend bei- 
30 spielhaft gezeigt: 

c) Transformation kompetenter Zellen 

Die Transformation von Bakterien (kompetente ZelUen, Hoststamm z. B. dH5ct, GIBCO BRL, Katalog Nr.: 18258- 
35 012) mit dem Ligationsansatz aus b) erfolgt nach einem der iiblichen Protokolle, wie z. B. in [J. Sambrook, E. F, Fritsch, 
T. Maniatis, Molecular Cloning, A Laboratory Manual, (1989)] beschrieben wird und das gemaB den Kenntnissen des 
Fachmanns variiert werden kann, z. B. wie folgt:. 

- 200 pi kompetenter Zellen 0V 5xl0 7 CFU = Colony Forming Units, bei -70°C gelagert) werden aufgetaut und 
40 auf Eis gestellt 

- Etwa 1 ng des Ligationsansatzes aus b) wird dazu pipettiert und 20-30 Minuten auf Eis stehen gelassen, alle 5 
Minuten vorsichtig mixen 

- Hi tzeschock: Ansatz 2 Minuten auf 42°C, zuriick auf Eis 

- 0,8 ml LB-Medium (+ 0,02 M MgS0 4 + 0,01 M KC1) zugeben 
45 - Ansatz 20-60 Minuten im Reagenzglas auf 37°C rollen 

- 0,1-1 ml auf Agarplatte (mit Antibiotikum, z. B. Ampicillin) ausplattieren und uber Nacht auf 37°C 

Die Transformation fungiert dabei als Selektionsverfahren auf erfolgreich klonierte Logomere und als Isolations ver- 
fahren einzelner Logomere, weil jede Bakterienzelle genau ein Plasmid exprimiert. 
50 AuBer dem gen annten Verfahren der Klonierung, das erfindungsgemaB bevorzugt ist, konnen die in Schritt V des er- 
findungsgemaBen Verfahrens erhaltenen informationstragenden Polymere (Logomere) mit folgenden Verfahren isoliert 
und vervielfaltigt werden: 

Isolation durch Hybridisierung und chromatographische Methoden 

55 

Hierbei wird das aus einer Symbolpplymerisation erhaltene Molekulgemisch uber ein Tragermaterial gegeben, an das 
Oligomere ("Ankersequenzen") gebunden sind, die ihrerseits an die Terminatoren der Logomere binden kdnnen. Die ge- 
bundenen Logomere werden dann einzeln aufgenommen und konnen nach Bedarf vervielfaltigt werden. Es sind hierzu 
verschiedene Verfahren einsetzban 

60 

a) Affinitatschromatographie; dabei werden Ankersequenzen, die zu den iiberhangenden Enden der Terminatoren 
(compatible Enden besitzen, z. B. an eine Hydroxylapatit-Saule gebunden. Die aus Schritt V des erfindungsgemaBen 
Verfahrens erhaltenen Logomere werden uber die Saule gegeben, wodurch die Logomere durch Hybridisierung an 
die Ankersequenzen binden konnen. Die solcherart gebundenen Logomere werden dann einzeln aufgenommen. 
65 b) Ankersequenzen werden an eine Membran (z. B. /Gene Screen Plus, DuPorit, Biotechnology Systems; Hybond- 

N, Amersharn Life Sciences) kovalent gebunden. Die Membran ist gerastert, d. h. in einzelne Felder unterteilt. Pro 
Feld wird genau eine Ankersequenz kovalent an die Membran gebunden. Danacb werden die aus Schritt V des er- 
findungsgemaBen Verfahrens erhaltenen Logomere uber die Membran gegeben und mit den Ankersequenzen hybri- 
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disiert. Die Membran wird daraufhin in die einzelneri Felder des Rasters zerschnitten. Die einzelnen Felder, die nun 
maximal ein an die jeweilige Ankersequenz gebundenes Logomer enthalten, konnen jetzt in separate GefaBe (z. B. 
Eppendorf Tubes) uberfuhrt werden. Sodann Ikonnen die Logomere durch Denaturieren von der Membran getrennt 
werden. Beim Denaturieren ist zu beachten, daB die Denaturierungstemperatur so gewahlt ist, daB sie hoch genug 
ist, urn Logomer und Ankersequenz zu trennen, jedoch nicht so hoch, daB das Logomer selbst vollstandig auf- 5 
schmilzt. 



Isolation durch Verdunnung 

to 

Bei der Isolation durch Verdunnung werden die Logomere, die als Gemisch aus einer Symbolpolymerisation erhalten 
werden, soweit verdiinnt, daB in einem jeweiligen Zielvolumen statistisch genau ein Molekul enthalten ist. Dieses kann 
dann mil Hilfe der PGR aufgespiirt und vervielfaltigt werden. Die Verdunnung des Ausgangsvolumens in Zielvolumina 
kann dabei gleichzeitig geschehen, so daB ein Ausgangsvolumen auf n Zielvolumina verdiinnt wird. Dazu wird erfin- 
dungsgemaB wie folgt vorgegangen: *5 
Zu einem, aus Schritt V des erfindungsgemaBen Verfahrens erhaltenen, Gemisch von Logomeren in einem Ausgangsvo- 
lumen V a wird ein Verdiinnungsfaktor ermittelt, der n in V a enthaltene Logomere so auf n Zielvolumina V z verdiinnt, daB 
in jedem Zielvolumen V 2 statistisch genau ein Logomer enthalten ist. Um den Verdiinnungsfaktor zu ermitteln wird ein 
Aliquot des Ausgangsvolumens (z. B. 1 pi) in einer Verdunnungsreihe austitriert. Von jeder Verdunnung der Reihe wird 
dann ein Aliquot (z. B. 1 ul) als Template einer PGR-Reaktion verwendet, um zu ermitteln, in welchen Verdunnungen 20 
noch Logomere detektierbar sind. Erhalt man solcherart die letzte Verdunnung, die noch Logomere enthalt, und die Ver- 
dunnung, die schon keine mehr enthalt, laBt sich ein ungefahrer Verdunnungsfaktor angeben, der gerade noch ungefahr 
ein Logomer enthalt. Gegebenenfalls kann dieser Verdunnungsfaktor durch Austitrieren der letzten ^rdiinnung, die 
noch Logomere enthalt, genauer bestimmt werden. Dabei verwendet man entsprechend kleinere Verdunnungsschritte 
(verdiinnt man z. B, in der ersten Verdunnungsreihe immer 1:10, so kann man in der 2. Verdunnungsreihe z. B. 1 : 2 ver- 25 
diinnen; das Verfahren der genaueren Bestimmung des Verdun nungsfaktors kann dabei prinzipiell mit beliebiger Genau- 
igkeit angewendet werden). 

Da die PGR der Verdunnungen dazu dient, festzustellen, ob sich iiberhaupt noch Logomere in der Verdunnung befin- 
den, kann die PGR auf mindestens zweierlei Weise durchgefuhrt werden: 

30 

a) Als Primer dienen zwei gegenlaufige, in den Terminatoren primende Primer, z. B. der 5-Strang des Start-Termi- 
nators und der 3-Strancfdes Ende-Terminators. Ansonsten sind die PGR-Bedingungen wie weiter unten unter \fer- 
vielfaltigung von Logomeren durch PGR beschrieben. 

b) Die PGR wird wie die zum Auslesen der Logomere durchgefuhrt, es reicht jedoch ein Ansatz mit einem Paar von 
Primern wie unter Auslesen von Logomeren mittels PGR im Folgenden beschrieben. 35 

Zur Kontrolle werden die durch PGR erhaltenen DNA Fragmente durch Gelelektrophorese sichtbar gemacht. Dazu 
wird z. B. ein 2-4%iges Agarose-Gel (z. B. UltraPure™ von Gibco BRL, Life Technologies, Katalog Nr.: 15510-027) 
und als Molekulargewichtsstandard z.B. eine 50bp-Leiter (Gibco BRL, Life Technologies, Katalog INr. 10416-014) 
verwendet. Das erhaltene Gel wird 5 Minuten in 0,001% Ethidiumbromid gefarbt und unter UV sichtbar gemacht. 40 

Vervielfaltigung von Logomeren 

Die aus einer Symbolpolymerisation erhaltenen Logomere konnen - je nach ihrer beabsichtigten , Verwendung - ver- 
vielfaltigt werden. Dies ist beispielsweise fur die Visualisierung der gespeicherten Information oder die Weiterverwen- 45 
dung der Logomere als Marker zur Kennzeichnung von Stoflfen und Gegenstanden notig. 

Vervielfaltigung von Logomeren durch PGR 

Bei diesem Verfahren werden Logomere durch FGR vervielfaltigt. Das zu vervielfaltigende Logomer dient als Tern- 50 
plate, die bendtigten Primer primen jeweils gegenlaufig in den Terminatoren (entweder 5-Start und 3*-Ende, oder 5'- 
Ende und 3-Start), so daB das Logomer vollstandig vervielfaltigt wird. Altemativ konnen die Primer, sofern das zu ver- 
vielfaltigende Logomer von weiterer DNA umgeben ist, auch weiter auBerhalb des Logomers primen. 

FCir die PGR-Ansatze, die in dem Fachmann bekannter Weise variiert werden konnen, werden z. B. folgende Reagen- 
tien und Bedingungen verwendet: 55 
dNTPs (z. B. Pharmacia Biotech, Katalog Nr.: 27-2035-01/2/3), Taq-Polymerase (z. B. Gibco-BRL, Katalog Nr.: 18038- 
034, 18038-042, 18038-067), PGR-Puffer, M g a 2 (z. B. GIBGO-BRL, Katalog Nr.: 18067-017) 
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10 



15 



40 





Menge (pi) 


dNTP, 10mM 


1 


PCR-Puffer 10x 


5 


MgCfe, 25mM 


5 


TAQ, 5u/pl 


0,5 


Primer 1, 10pM 


1 


Primer 2, 10pM 


1 


Template 


1 


(Logomer) 




H 2 0 


35,5 


Gesamtvolumen 


50 



20 Als PCR-Programm kann beispieisweise folgendes Protokoll (Primer: 30-mere) verwendet werden: 





Schritt Aktion 


Temperatur 


Dauer 


Gehe zu Anzahl 












Schritt Wiedertiolungen 


25 


1 


Denaturiere 


95 °C 


00:05:00 






2 


Denaturiere 


95 °C 


00:00:30 






3 


Annealing 


68 °C 


00:00:30 




30 


4 


Polymerisation 


72 °C 


00:00:30 






5 


Gehe zu 






2 29 




6 


Kuhlen 


4*C 


(betiebig) 




35 


7 


Ende 









Ein weiterer Gegenstand der Erfindung sind informationstragende Polymere, die gemaB den oben beschriebenen er- 
findungsgemaBen Verfahren erhaltlich sind. 

Auslesen der in Logomeren enthaltenen Information 



Fertige Logomere konnen entweder mittels PGR (Polymerase Chain Reaction = Polymerasekettenreakuon), was erfin- 
dungsgemaB bevorzugt ist, oder mittels Restriktionsverdau gelesen werden. Dabei hat die PCR-Methode den \brzug, be- 
reits geringste Mengen DNA solcherart vervielfaltigen zu konnen, daB die Logomere direkt nach der PGR und einer Gel- 
Auftrennung gelesen werden konnen. Im Falle von binaren Logomeren kann das durch die PCR-Methode auf einem Gel 
45 erhaltene Bandenmuster unmittelbar als Binarcode gelesen werden. 

Ein weiterer Gegenstand der Erfindung ist daher ein \ferfahren zum Auslesen von Information aus informationstragen- 
den Polymeren, die wie oben beschrieben erhalten und/oder isoliert und vervielfaltigt wurden, dadurch gekennzeichnet, 
daB man 

50 a) n das informationstragende Polymer enthaltende Losungen mit jeweils einem Paar gegenlaufiger Primer ver- 

setzt, wobei n fur die Zahl der als Elongatoren in dem Polymer enthaltenen Oligomere steht; 

b) mindestens n-1 PCR-Ansatze durchfuhrt, wobei n fur die Zahl der als Elongatoren in dem Polymer enthaltenen 
Oligomere steht Lihd jeweils ein Primer eines jeden Paares in dem dem Elongator gegeniiberliegenden Terminator 
primt und der andere Primer in dem Elongator selbst primt; 
55 c) die aus der PGR erhaltenen Polymer-Fragmente nach ihrer Lange durch Elektrophorese auftrennt und d) das aus 

der Elektrophorese erhaltene Muster optisch ausliest. 

Das Verfahren kann auch unter Verwendung verschiedenfarbiger fluoreszenzmarkierter Primer oder Nukleotide 
durchgefuhrt werden. Dadurch wird es moglich, mehrere Ansatze verschiedenfarbig zu markieren und mehrere Ansatze 
60 in einer Spur gelelektrophoretisch zu lesen. Uberdies kann der AusleseprozeB dadurch mit modernen Sequenziermaschi- 
nen (z. B. von ABI erhaltlich) automausiert werden. 

Auslesen von Logomeren mittels PGR 

65 Urn die in Logomeren enthaltenen Informationen sichtbar zu machen, konnen die Logomere mithilfe der PGR ausge- 
iesen werden. Die Methode des Auslesens binarer Muster mit PGR wurde als DNA Typing bereits von [Jeffreys, Mini- 
satellite reapeat coding as a digital approach to DNA typing, Nature, 354, 204-209, (1991)] beschrieben. Die dort be- 
schriebene Methode wird hier in einer abgewandelten Form als Auslese-PGR zum Auslesen der Logomere benutzt. Un- 
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terschiede zu der in [Jeffreys, Minisatellite reapeat coding as a digital approach to DNA typing, Nature, 354, 204-209, 
(1991)] beschriebenen Methode bestehen darin, daB hier synthetisch erzeugte Templates verwendet werden, die nicht 
notwendig binare Muster enthallen. AuBerdem werden PGR- und Gel-Elektrophorese-Bedingungen so gewahlt, daB das 
Ergebnis direkt vom Gel gelesen werden kann, ohne daB die als Bandenrhuster erhaltenen Signale zusatzlich durch Blot- 
ting verstarkt werden miissen. 

a) PGR 

Fiir das Auslesen eines Logomers werden fur n Elongatoren der zugrundeliegenden Grammatik mindestens n-1, mei- 
stens aber n PCR-Ansatze gebraucht. Jeder PGR- Ansatz enthalt das zu lesende Logomer als Template und auBerdem ein 
Paar gegenlaufiger Primer, von denen einer im Elongator, der andere im, dem Elongator gegenuberliegenden, Terminator 
primt (z. B. 5'-"Start" und 3'-0, siehe Abb. 5). Fur die PGR kann jeder handelsiibliche Thermozykler (z. B. PTC-100, MJ 
Research) verwendet werden. Als zweckmaBig fur die Lange der Primer haben sich 20-30 bp erwiesen, jedoch sind auch 
andere Langen verwendbar. Je nach Primerlange muB die Annealing-Temperatur entsprechend gewahlt werden (kann 
z. B. mithilfe des Programmes Oligo 5.0 bestimmt werden). ZweckmaBige Annealingtemperaturen sind fur 20-mere ca. 
55°C, fur 30-mere etwa 65°C bis 74°C. Fiir die PCR-Ansatze werden z. B. folgende Reagentien und Protokolle verwen- 
det, die in dem Fachmann bekannter Weise variiert werden konnen: 

dNTPs (Pharmacia Biotech, Katalog Nr.: 27-2035-01/213), Taq-Polymerase (Gibco-BRL, Katalog Nr.: 18038-034, 
18038-042, 18038-067), PCR-Puffer, MgCl 2 (GIBCO-BRL, Katalog Nr.: 18067-017) 





Menge (pJ) 


6NTP, 10mM 


1 


PCR-Puffer 10x 


5 


MgCfe, 25mM 


5 


TAQ, 5u/pl 


0,5 


Primer 1, 10|jM 


1 


Primer 2, 10pM 


1 


Template 


1 


(Logomer) 




H z O 


35,5 


Gesamtvolumen 


50 



Um genugend DNA zu erhalten, so daB das erhaltene Bandenmuster nach der Gelelektrophorese direkt vom Gel gele- 
sen werden kann, kann jeder PCR-Ansatz m rnal angesetzt werden. Z. B. kann m = 4 sein. 
Als PCR-Programm kann folgendes Protokoll (Primer: 30-mere) verwendet werden: 



Schritt Aktion 



Temperatur Dauer 



Gehe zu Anzahl 
Schritt Wiederholungen 



1 


Denaturiere 


95°C 


00:05:00 


2 


Denaturiere 


95 P C 


00:00:30 


3 


Annealing 


69,5 °C 


00:00:30 


4 


Polymerisation 


72 °C 


00:00:30 


5 


Gehe zu 






6 


Kuhlen 


4°C 


(beliebig) 


7 


Ende 







29 



10 



15 



20 



25 



30 



35 



40 



45 



50 



55 



Nach durchgefuhrter PCR ist es fur die Lesbarkeit der Bandenmuster der nachfolgenden Gelelektrophorese evtl. 
zweckmaBig, moglichst viel amplifizierte DNA in moglichst geringem Vblumen zu halten, das dann auf eih Gel geladen 
werden kann. Dazu konnen die Volurnina auf geeignete Weise (z. B. mit einer SpeedVac, z. B. SpeedVac Concentrator, 
Savant) eingeengt werden. 60 

b) Gelelektrophorese 



Die fur jeden Elongator aus der PCR erhaltenen DNA Fragmente haben verschiedene Larige. Werden sie durch Elek- 
trophorese aufgetrennt, so ergeben die unterschiedlichen Langen fragmente ein spezifisches Muster, anhand dessen sich 
das zu lesende Logomer identifizieren laBt (siehe Abb. 5 und Abb. 6). Fiir die Gelelektrophorese kann ein 4% Agarose- 
Gel (z. B. UltraPure™ von Gibco BRL, Life Technologies, Katalog Nr.: 15510-027), als Molekulargewichtsstandard 
z. B. eine 50bp-Leiter (Gibco BRL, Life Technologies, Katalog Nr.: 10416-014) verwendet werden. Die Auftrennung 
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der DNA erfolgt in einer Gelkammer in geeigheier Weise, z. B. 1 : 45 Stunden bei 60 V. Hier sind die Parameter jedoch 
relativ frei wahlbar, insbesondere kann die Gel-Laufzeit weiter verkiirzl werden. 

Das erhaltene Gel wird 5 Minuten in 0,001% Ethidliumbromid gefarbt und unter UV sichtbar gemacht 

Ein Beispiel fur ein solcherart erhaltenes Gel findet sich exemplarisch unter Abb. 6. 

5 

Auslesen von Logomeren durch Restriktionsverdau 

Logomere konnen durch Restriktionsverdau ausgelesen werden; Dazu mussen die Elongatoren so konstruiert sein, daB 
sie asyminetrisch versetzte Restriktionsschnittstellen tragen. Jeder Elongator tragt dabei eine spezifische Restriktions- 
10 schnittstelle. Beispielsweise kann das Restriktionsenrym EcoRV (z. B. NEB, Katalog Nr. #195S) fur 0-Elongatoren und 
Smal (z. B. NEB, Katalog Nr. #141 S) fur 1 -Elongatoren verwendet werden. 

Zurn Lesen wird das zu lesende Logomer in verschiedenen Restriktionsansatzen geschnitten. Dazu wird pro Elongator 
ein Restriktionsansatz mil dem jeweiligen Restriktionsenzym gebildet. Die aiis der Restriktion erhaltenen DNA Frag- 
mente sind von verschiedener Lange. Werden sie durch Elektrophorese aufgetrennt, so ergeben clie unterschiedlichen 
15 Langenfragmente ein spezifisches Muster, anhand dessen sich das zu lesende Logomer identifizieren laBt. 

Das folgende Beispiel zeigt die DNA-Fragmendangen aller binaren Logomere mit 4 Bit ohne Terminatoren mit Elon- 
gatorlange = 30 bp; Restriktionsschnittstelle pro Elongator nach 10 bp. 



Binarzahl 


o 


1 




0000 


10, 40, 40, 40, 30 


160 




0001 


10, 40,40,70 


130, 30 




0010 


10, 40, 80, 30 


90, 70 


* 


0011 


10, 40, 110 


90, 40, 30 




0100 


10, 80, 40, 30 


50, 110 


• 


0101 


10, 80, 70 


50, 80, 30 




0110 


10, 120, 30 


50, 40, 70 




0111 


10, 150 


50, 40, 40, 30 




1000 


50, 40, 40, 30 


10, 150 




1001 


50, 40, 70 


10, 120, 30 




1010 


50, 80, 30 


10, 80, 70 




1011 


50, 110 


10, 80, 40, 30 


* 


1100 


90, 40,30 


10,40, 110 




1101 


90, 70 


10, 40, 80, 30 


* 


1110 


130, 30 


10, 40, 40, 70 




1111 


160 


10, 40, 40, 40, 30 





Im obigen Beispiel (4 Bits) erkennt man, daB die Langenmuster der Zahlen 0010 und 0100 bei Restriktion des 0-Bits 
nicht eindeutig ist. 0010 und 0100 lassen sich jedoch anhand der Langenmuster bei Restriktion des 1-Bits unterscheiden. 
Im Einzelnen wurde zur Durchfuhrung des obigen Beispiels folgendermaBen vorgegangen, wobei sich die ProtokoUe 
50 gemaB den Kenntnissen des Fachmanns variieren lassen: 

a) DNA Extraktion 

Eine z. B. durch Vereinzelung und Vervielfaltigung von Logomeren durch Klonierung erhaltene Bakterienkolonie 
55 wird zum Animpfen von 2-5 ml einer 37°C Ubernachtkultur verwendet (z. B. LB-Medium mit 10 ug/1 Ampicillin wie in 
[J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular Cloning, A Laboratory Manual, (1989)] beschrieben). Als Klonie- 
rungsvektor konnen hier z. B. pGEM-T Easy (Promega, Katalog Nr. A1360) und binare Logomere auch ohne Termina- 
toren verwendet werden. Aus der Obernachtkultur wird die das Logomer enthaltende Plasmid-DNA isoliert (z. B. mit- 
hilfe des Qiagen Plasmid Miniprep Kit, Qiagen, Katalog Nr. 12123, oder durch alkalische Lyse wie in [J. Sambrook, E. F. 
60 Fritsch, T. Maniatis, Molecular Cloning, A Laboratory Manual, (1989)] beschrieben). 

b) Restriktion 

Die aus a) erhaltene Plasmid DNA wird fiir n Elongatoren in n Restriktionsansatzen geschnitten. Jeder Restriktions- 
65 ansatz enthalt ein Restriktionsenzym, das in einem spezifischen Elongator schneidet und ein Restriktlionsenzym, das das 
Logomer aus der Klonierungssite ausschneidet. Im verwendeten Beispiel wurden folgende Ansatze verwendet: 
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Name 


Menge 


Voiumen (pi) 


Plasmid 


Logomer in pGEM-T 500ng/(jl 


6 


DNA 


Easy (s.o.) 






Puffer 


NEB2 


10x 


1 


BSA 




lOX 


1 


Enzym 1 


Eco RV 


10u/pl 


1 


Enzym 2 


Eco Rl 


10u/pl 


1 


Total 






10 




Name 


Menge 


Voiumen (pi) 


Plasmid 


Logomer in pGEM-T 500ng/pl 


6 


DNA 


Easy (s.o.) 






Puffer 


NEB4 


10x 


1 


BSA 




10x 


0 


Enzym 1 


Sma I 


10u/pl 


1 


Enzym 2 


Eco Rl 


10u/pl 


1 


H 2 0 






1 


Total 






10 



Die angegebenen Ansatze werden 1 Stunde auf 37°C inkubiert. 

c) Gelelektrophorese 

Die aus b) erhaltenen DNA Fragmente werden elektrophoretisch aufgetrennt (z.B. 4% Agarose UltraPure™ von 
Gibco BRL, Life Technologies, Katalog Nr.: 15510-027), mit Ethidiumbromid (0,001%) gefarbt und unter UV sichtlbar 
gemacht (siehe Abb. 8). 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die Implemeritierung binarer Logomere: 
Binare Logomere werden mit Grammatiken erzeugt, in denen gilt: 

S: = {0, 1, s 0 , s t , s 2 , . . s n . t , s n , eo, e l7 e 2 , . . ero-L, e„,} mit n, m € eNundn, m > 0. 

Sie ermoglichen die einfachste und universellste Darstellung von Daten, wie sie auch von herkommlichen Datenver- 
arbeitungsmaschinen eingesetzt wird. Binare Logomere sind Resultat einer Bitpolymerisation. Da abhangig von der je- 
weils gewahlten Grammatik nahezu beliebige Symboie und Regeln kodiert werden konnen, konhen damit ebenso belie- 
bige Daten und Datentypen erzeugt werden. 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die Implementierung von Zeichenalphabeten: 
Logomere konnen eingesetzt werden, um die Zeichen eines gewahlten Alphabetes zu kodieren. Die Zeichenlange kann 
dabei unterschiedlich gewahlt werden, sinnvoll ist es jedoch, die auch fur herkommliche Daten verarbeitungsanlagen be- 
nutzten Zeichenlangen (Halbbyte, 1-Byte, 2-Byte, 4-Byte, 8-Byte usw.) zu verwenden. Ebenso ist die Konyention fur die 
Interpretation der dargestellten Zeichen wahlfrei. Gie 2^eichen konnen Zahlen, Buchstaben, alphanumerische Zeichen 
oder beliebige andere Datenstrukturen sein. 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die Implementierung eines 1-Byte Alphabetes: 
Es sei eine Grammatik G = (£, V, R, S) mit Terminalalphabet Z: = {0, 1, s, e}, Variablenmenge 

V: = { So, Si, S 2 , S3, S 4 , S5, S6, S7, Sg}, Startsymbol S und Regelmenge) R: = 
{ 

S: = sS 0 
S 0 — OSl 

50— ISl 

51 — 0S 2 

51— 1S 2 

5 2 - 0S 3 

5 2 1S 3 

5 3 - 0S 4 
S 3 - 1S 4 

s 4 — os 5 



10 



15 



20 



25 



30 



35 



40 



45 



50 



55 



60 



65 
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S 4 — 1S 5 

s 5 ^os 6 
s 5 - is 6 
s 6 — os 7 

5 S 6 -*1S 7 

s 7 — os 8 
s 7 — is 8 

Sg — e 
} . 

10 

wobei: 
s := Start 

e := Ende Beispiel: 

nach den Regeln der angegebenen Grammatik konnen alle 8-Bit Zeichen erzeugt werden: 
is z. B.: Erzeugung der 8-Bit 0,00000000: 

S -> sS 0 — sOSi — s00S 2 — s000S 3 — SGOOQS4 — s00000S 5 — s000000S 6 — s0O0O0O0S 7 — sOOOOOOOOS* — 
sOOOOOOOOe 

20 z. B.: Erzeugung der 8-Bit 255, 11111111: 

S^sSi^slSi^sllS2^slllS3^sllllS4^slllllS^ 

z. B.: Erzeugung der 8-Bit 85, 01010101: 

25 

S sS 0 — sOSi — s01S 2 — s010S 3 — ^ SOIOIS4 — s010lOS 5 — s010101S 6 — s0101010S 7 — s0101010lS8 — 
sOlOlOlOle 

Die fur die Implementierung in vitro benotigten Sequenzen werden nach dem NFR- Verfahren, wie in den erfindungs- 
30 gemaBen Schritten II und m beschrieben, hergestellt. Algomere und Logomere werden, wie in den erfindungsgemaBen 
Schritten IV-V beschrieben, hergestellt und die erhaltenen Logomere vorzugsweise mittels des unter Vereinzelung und 
Vervielfaltigung von Logomeren durch Klonierung beschriebenen Verfahrens isoliert und vervielfaltigt. Die solcherart 
erzeugten alphanumerischen Zeichen konnen jetzt fur verschiedene technische Zwecke (z. B. die Markierung und Iden- 
tifizierung von Stoffen) eingesetzt werden und, evtl. nach zusatzlichen technischen Schritten, gemaB dem erfindungsge- 
35 maBen Verfahren zum Auslesen von Information aus informationstragenden Polymeren (wie oben beschrieben) ausgele- 
sen werden. 

Da die hier erzeugten Binarmuster wahlfrei als Daten und Symbole gelesen werden konnen, konnen sie z, B. als al- 
phanumerische Zeichen interpretiert werden. Werden sie als Zahlen interpretiert, so erzeugt die angegebene Grammatik 
3 -Bit Zufallszahlen. Aus einer genugend groBen Menge zufalliger 8-Bit Binarmuster konnen alle 8-Bit Muster isoliert 

40 und als Bibliothek (z. B. zur Darstellung aller alphanumerischen Zeichen) angelegt werden. 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die Darstellung von Zeichenketten: 
Da Algomere so hergestellt werden konnen, daB sich unterschiedlich lange Logomere erzeugen lassen, ist es moglich, 
auch Zeichenketten darzustellen. Aus praktischen Grunden ist es jedoch zweckmaBig, nur wenige Zeichen pro Logomer 
vorzusehen. Z. B. kann ein einzelnes Logomer 4 Bit (Halbbyte) oder 8 Bit (1 Byte) enthalten. (Falls mehr Bit erforderlich 

45 sind, sollten zweckmaBigerweise immef Vielfache von 8 Bit = 1 Byte verwendet werden.) In Binardarstellung konnen 
dann beliebige alphanumerische Zeichen in beliebiger Kodierung (z. B. ASCII, ANSI, ISO 8859-x, Unicode) dargestelltt 
werden. Dabei kann sich ein Zeichen auch uber mehrere Logomere erstrecken (Bsp.: Halbbyte-Darstellung, bei der sich 
jeweils ein I -Byte Zeichen uber zwei Logomere erstreckt, oder Unicode, bei der sich ein 16-Bit Zeichen uber zwei 8-Bit 
oder vier 4-Bit Logomere erstreckt). Fur die Darstellung von Zeichenketten ist es dann notig, die einzelnen Zeichen mit 

50 Positionsinformation zu versehen. Dazu reicht es, in den jeweiligen Grammatiken verschiedene Terminatoren (z. B. ver- 
schiedene "Start'^Terminatoren) zu verwenden, deren Sequenzen jeweils die Positionsinformation reprasentieren. Bei- 
spiel: Es sei eine Grammatik G = (£, V, R, S) mit Terminalalphabet X: - (0, 1, e, sq, s u S2, . . ., s^i, s n }, Variablenmenge 
V: = (So, Si, S2, S3, S 4 , S5, S6, S 7 , Sg} , Startsyrnbol S und Regelmenge R: = 

55 { 

S := sjSo 
SO — OS! 

50— IS! 

51— 0S 2 

60 SI — 1S 2 

52— +0S 3 , 
S2— 1S 3 t 
S3 — 0S 4 

S3 — 15 4 
65 S4-^0S 5 
S4^1S 5 
S5 — 0S 6 
S5 — 1S 6 
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S6 — 0S 7 

56 — IS7 
S7-*0S 8 

57 — 1S 8 

58 — e 5 
} 

wobei: 

s; ; = Start, mit i = {0, n} 

e:=Ende. 10 

Das mit dieser Grammatik erzeugte 1-Byte Alphabet reicht z. B. fur alle alphanumerischen Zeichen des ASCII, ANSI 
oder ISO 8859-x Standards. Fur eine Zeichenkette der Langen werden n verschiedene Terminatoren bendtigt, so da8 die 
mit dieser Grammatik erzeugten Zeichenketten wie folgt aufgebaut sind: 
soxe, s L xe, . . ., s^xe, SnXe 

wobei x eine beliebige Binardarstellung mit, in diesem Fall, 8 Bit ist. 15 

Es bedeutet dann: 
soxe: = Zeichen x an Position 6 (O.tes Zeichen) 
spce: = Zeichen x an Position 1 (l.tes Zeichen) 
S2xe: = Zeichen x an Position 2 (2.tes Zeichen) 

usw. 20 
Mit der Grammatik laBt sich beispielsweise die Zeichenkette "Elisabeth" im ASCII-Code darstellen: 

so01000101e, sjOHOllOOe, s 2 0110l001e, s 3 01110C)lle, s 4 01100001e, s 5 01100010e, s 6 01100l01e, S7 01110100e, 
SgOllOlOOOe 



Alternativ kann auch X: = {0, 1, s, eo, e^ e^ . . e^, e^ gewahlt werden, wodurch die Zeichenkette "Elisabeth" im 
ASCII-Code als: 



25 



sOlOOOlOle^, sOUOHOOe!, sOllOlOOle^ s01110011e 3 , s01100001e 4 , sOU00010e 5 , s01100101e 6 , sOlllOlOOe?, 
sOUOlOOOeg 30 

dargestellt wird. Eine weitere.Moglichkeit ist £: = {0, 1, sq, S\ 9 S2, . . s n ^, s n , eo, e!, e^ . . e,,^, e,,}, womit die Zeichen- 
kette "Elisabeth" im ASCII-Cade als: 

so01000101eo, siOllOllOOeo, s 2 01101001e 2 , s 3 01110011e 3 , ^OllOOOOle* s 5 01100010e 5 , seOllOOlOlee, S7011101G0e7, 35 
sgOllOlOOOeg 

dargestellt wird. 

In Halbbyte-Darstellung mit Position sinformation wurde die Zeichenkette "Elisabeth" im ASCII-Code dargestellt als: 

40 

solOOe, SiOlOle, s 2 0110e, s 3 1100e, ^OllOe, s 5 1001e, ^Ollle, s 7 0011e, s 8 0110e, S9 0001e, s lo 0110e, s u 0010e, s l2 0110e, 
s 13 0101e, si 4 0111e, SisOlOOe, s 16 0110e, s 17 1000e 

Aufgrund der Positionsinformation, die durch die Sequenz der Terminatoren reprasentiert wird, konnen die einzelnen 
Zeichen vollig unabhangig voneinander verarbeitet werden und z. B. getrennt voneinander gelesen werden. Mit einem 45 
solchen Alphabet ist die Darstellung beliebiger Datentypen moglich. Z; B. konnen z. B. jeweils zwei Byte (0. + 1., 2. + 
) 3., . . ., n. + n+1.) zu einem 2-Bytecode (z. B. Unicode) zusammengefaBt werden. Alphanumerische Zeichenketten kon- 

nen verwendet werden, um beliebige Bezeichner (Namen, Zahlen, Datum usw.) darzustellen. 

Die fiir die Implementierung in vitro benotigten Sequenzen werden nach dem NFR-Verfahren, wie in den erfindungs- 
gemaBen Schritten II und HI beschrieben, hergestellt. Algomere und Logomere werden, wie in den erfindungsgemaBen 50 
Schriflen IV- V beschrieben, hergestellt, die erhaltenen Logomere vorzugsweise mittels des unter Vereinzelung und Ver- 
vielfaltigung von Logomeren durch Klonierung beschriebenen Verfahrens isoliert und vervielfaltigt Die solcherart er- 
zeugten alphanumerischen Zeichen und Zeichenketten konnen jetzt fur verschiedene technische Zwecke (z. B. die Mar- 
kierung und Identifizierung von Stoffen) eingesetzt werden und, evtl. nach zusatzlichen technischen Schritten, gemafi 
dem erfindungsgemaBen Verfahren zum Auslesen von Information aus informationstragenden Polymeren (wie oben be- 55 
schrieben) ausgelesen werden. 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die Implementierung eines Zufallszahlengenerators: 
Fiir bestimmte Probleme der Informatik (z. B. Simulationen) und der Mathematik werden Zufalls zahlen benotigt. Diese 
werden im allgemeinen rechnergestiitzt durch Algorithmen erzeugt. Da diese Algorithmen jedoch deterministisch sind, 
handelt es sich bei den erzeugten Zufallszahlen nur um Pseudo-Zufallszahlen. Oberdies sind die erzeugten Zahlenreihen 60 
aufgrund der unterschiedlichen Giite der Algorithmen unterschiedlich gut randomisiert. Fiir manche Anwendungen wer- 
den daher echte Zufallszahlen benotigt. Ist dies der Fall, muB ein physikalischer ProzeB in die Erzeugung von Zufalls- 
zahlen einbezogen werden. Ein solcher ProzeB ist etwa das Rauschen der Soundkarte in einem PC, das von entsprechen- 
der Software verarbeitet wird. 

Mithilfe der hier beschriebenen Verfahren kann ein echter Zufallszahlengenerator implementiert werden, der Zuf allszah- 65 
len sehr viel schneller erzeugt, als es mit herkomrnlichen Verfahren moglich ist. 

Der Zufallszahlengenerator wird mit folgender Grammatik implementiert (Grammatik fur binare Zufallszahlen beliebi- 
ger Lange): . 
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G = (Z, V, R, S) mil 2: = (0, 1, s, e}, V: = {S}, 
R: = 

{ 

5 S: = sA 
A — OA 
A — 1A 
A->e 
} 

10 

wobei 
s: = Start 
e: = Ende 

Mit dieser Grammatik konnen Worter uber dem oben angegebenen Terrainalalphabet L = {0, 1 , s, e} gebildet werden. 
15 Alle Worter der Sprache L beginnen mit "s" und horen mit "e" auf, dazwischen befindet sich eine zufallige Anzahl (auch 
0) zufalliger Bits ("0" und "1"). 

Beispiel: Worter aus der Sprache L, die nach R gebildet werden: 

S — ► sA — ► se 
20 S — ► sA -+ slA — * sle 

S — s A — sOA — sOOA — sOOlA s 001 OA — sOOIOe 

S — ► s A — ► slA slOA — slOOA — si 000 A — slOOOOA — si 00000 A — slOOOOOe 

Die als Worter der Spache L erzeugten Binarmuster konnen als Buchstaben, Zahlen, alphanumerische Zeichen oder 
25 Zeichenketten gelesen werden. Liest man sie als die Binardarstellung von Zahlen, so sind diese Binarmuster in Dezimal- 
darstellung: 

03 (leer) 
1 

30 2 
32 

und konnen als Zufallszahlen verwendet werden. Zur in vitro Implementierung eignen sich prinzipieil beliebige Sequen- 
zen, solange sie eindeutig und zueinander maximal unahnlich sind. Z. B. konnen folgende Aigomere verwendet werden: 

35 

sA: 

agctttatatctccatttgccctagtgaag 

aatatagaggtaaacgggatcacttcaacc 

40 

A->0A: 

ttggcgagatatcaacgccaccccttgctt 
45 gctctatagttgcggtggggaacgaaaacc 



A->1A: 

so ttggcgacccgggaaacaactattgctagt 

gctgggccctttgttgataacgatcaaacc 



A->e: • ■ ' 

55 

ttggtgcgggagttggaagcaactacgatg 

acgccc t caacc t t cgt tga t gc t acc tag 

Die dazu benotigten Sequenzen sind handelsublich. Sie konnen z.B. bestellt werden als 40nmol, PAGE gereinigt 
60 (ARK-Scientific, Darmstadt) und z. B. 100 uM in Aqua dest. aufgenommen werden (empfohlene Lagerung bei -20°C). 
Aus den Sequenzen werden, wie im erfindungsgemaBen Schritt IV beschrieben, Aigomere hergestellt Diese Aigomere 
werden, wie im erfindungsgemaBen Schritt V beschrieben, zu Logomeren polyrnerisiert und konnen gemafi dem erfin- 
dungsgemaBen Verfahren zum Auslesen von Information aus informationstragenden Polymeren (wie oben beschrieben) 
ausgelesen werden. Derart erzeugte Zufallszahlen sind in Abb. 6 zu sehen. 
65 Die oben beschriebenen Verfahren ermoglichen beispielsweise die Verschliisselung von Logomeren: 

Die in Logomeren enthaltene Information kann verschliisselt werden. Dazu fungiert mindestens einer der fur die Aus- 
lese-PCR benotigten Primer als geheimer Schlussel (siehe Abb. 11). Bevorzugt ist dies einer der in den Terminatoren pri- 
menden Primer. Ist die Sequenz dieses Primers (Schlusselsequenz) und der Primer selbst nur autorisierten Zugreifem be- 
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kannt, so ist die in den derart verschlusselten Logomeren enthaltene Information auch nur autorisierten Zugriffen zu- 
ganglich. 

Um ein Auslesen der in den Logomeren enthaltenen Information ohne diesen Schlussel zu verhinderri, miissen weitere 
Vorkehrungen getroffen werden. Versuche, die Verschlusselung zu brechen, konnen darauf beruhen, iiber die Vervielfal- 
tigung nicht-geheimer Sequenzen auch die Logomere zu lesen. Sofern bakterielle Vektoren zur Klonierung von Logome- 5 
ren verwendet werden, konnte ein potenueller Angreifer z.B. versuchen, die gesamte Klonierungssite mit PGR zu ver- 
vielfaltigen und dann mit Sequenzierung zu lesen oder iiber die zur Selektion benotigten Resistenzgene in die Klonie- 
rungssite "hineinzulesen". Auch konnte n die Elongatoren selbst als Ansatzpunkte fur ein PCR-basiertes Lesen der gehei- 
men Sequenz(en) dienen. 

Solchen Angriffsversuchen ist gemein, daB sie iiber nicht-geheime Sequenzen versuchen konnten, die Schlusselse- 10 
quenz zu entschlusseln und dariiber die verschlusseite Sequenz zu lesen. Eine Abwehr derartiger AngrifFsversuche kann 
dadurch erfolgen, daB zum Informationstransport iiber Logomere immer nur vollstandig geheime Sequenzen verwendet 
werden. Jedoch ist dies evtl. zu aufwendig und kostentrachug. Stattdessen oder erganzend dazu konnen die informations- 
tragenden Logomere mit Sequenzen (Schein sequenzen) versetzt werden, die dieselben potentiellen Angriffspunkte (z. B. 
Bits* Resistenzgene) enthalten, jedoch jeweils andere Schliisselsequenzen. Durch diese Scheinsequenzen laufen poten- 15 
tielle AngifFs versuche ins Leere, weil fur den nicht- autorisierten Zugreifer alle Einzelsequenzen ununterscheidbar und 
dadurch die verschlusselten Informationen verborgen sind. Mit je mehr Scheinsequenzen ein Logomer versetzt ist, um so 
schwieriger wird es, die Schlusselsequenz zu brechen. 

Das Verfahren entspricht einer molekularen Steganografie und wird exemplarisch anhand der Verschlusselung von 
Zeichen eines 1-Byte Alphabetes gezeigt: 20 
Es sei die verwendete Grammatik G = (L 9 V, R, S) nmt Terminalalphabet Z: = {0, 1, s key > sq, si, s 2 , . . ., sm, Sf, e}, wobei f 
e N, f > L s kcy ist der geheime Schlussel. Fiir eine Schliissellange von I ist dann die maximale theoretische Verschlus- 
selung Key ^ = a 1 , die maximal verwendbare Verschlusselung Key ef f = a ! ~ d , wobei d die Anzahl der Basen angibt, in der 
sich ein Scheinschliissel von dem richtigen Schlussel unterscheiden muB, damit in der Auslese-PCR kein Schein schliis- 
sel die richtige Sequenz lesen und umgekehrt der richtige Schlussel kein Scheinlogomer (sondern nur das Ziellogomer) 25 
auslesen kann. Fiir hochspezifischePCR Konditionen kann d > 1 werden. Weiterhin gibt Key^p = Anzahl iScheinschlus- 
sel + 1 die tatsachlich verwendete Verschlusselung und Key,,^ = 1 + x die minimale Verschlusselung an. Dabei ist x die 
zu einer minimalen Verschlusselung notige Anzahl von Scheinlogomeren. Diese kann im Falle der Verwendung von n 
Logomeren als Informationstrager groBer als n gewahlt werden. 

Fiir Zeichenketten ergibt sich automatisch eine zusatzliche Verschlusselung, weil hier die fur einen potentiellen An- 30 
greifer unbekannte Reihenfolge der Zeichen zusatzlich verschliisselnd wirkt. 

Beispiel: Fiir eine Grammatik mit Zeichenketten von n 1-Byte Zeichen wird folgende Grammatik G verwendet: 
Es sei G = (£, V, R, S) mit Terminalalphabet Z: = {0, 1, s key o, s key i, s key 2, . • Skey^i, s key n, sq, s u s 2 , - . Sf_i, Sf, e}, wobei 
n, f e N, n > 1 . n gibt dabei die Anzahl der verwendeten echten Schlussel, f die Anzahl der verwendeten Scheinschliis- 
sel an; die verwendete Variablenmenge V und die verwendete Regelmenge R sind dabei wahlfrei und abhangig von der 35 
zu kodierenden Information. 

Grammatiken mit anderer Zeichenkodierung funktionieren analog. Die fur die Implementierung in vitro benotigten 
Sequenzen werden nach dem NFR- Verfahren, wie in den erfindungsgemaBen Schritten II und HI beschrieben, herge- 
stellt. Algomere und Logomere werden, wie in den erflndungsgemaBen Schritten IV- V beschrieben, hergestellt, die er- 
haltenen Logomere vorzugsweise mittels des unter Vereinzelung und Vervielfaltigung von Logomeren durch Klonierung 40 
beschriebenen Verf ahrens isoliert und vervielfaltigt. Die solcherart erzeugten Logomere konnen, wie bereits als Auslese- 
PCR beschrieben, ausgelesen werden, wobei - wie beschrieben - einer der zum Auslesen benotigten Primer, bevorzugt 
einer der in den Terminatoren primenden Primer, als geheimer Schlussel fungiert. Mit der oben beschriebenen Gramma- 
tik werden zusatzlich zu den information stragenden Logomeren "Scheinsequenzen" ("Scheinlogomere") erzeugt, die ei- 
nen nicht-autorisierten Auslese-Zugriff auf die in den Logomeren enthaltenen Informationen verhindern sollen. Das \fer- 45 
fahren kann fiir alle Anwendungen von Logomeren benutzt werden und hat u. a. den Vorzug, durch die Spezifitat des als 
geheimer Schlussel benutzten Primers sehr effektiv zu sein. 

Basierend auf der beschriebenen Methode konnen symmetrische und asymmetrische \ferschliisselungsverfahren im- 
plementiert werden. Fiir ein symmetrisches Verschltisseiungsverfahren reicht es, daB sich die Teilnehmer A und B einer 
Kommunikation auf eine geheimgehaltene Schlusselsequenz einigen. Teilnehmer B verschliisselt eine als Logomer ge- 50 
speicherte Nachricht an A, indem B Logomere nur mit den geheimen Terminatoren herstellt und seine Nachricht mit zu- 
satzlichen Logomeren versetzt, die andere Terminatoren tragen. Nur A ist es dann moglich, das zum Auslesen benotigte 
Primerpaar bereitzustellen, da nur A die benotigte Terminatorsequenz kennt. 

Ein asymmetrisches Verschlusselungs verfahren erfordert dagegen zusatzlichen Aufwand, z. B. den Einsatz von Mole- 
kulen mit irregularen Formen (siehe z. B. Abb, 12 und Abb. 13): Will ein Kommunikationsteilnehmer B eine verschliis- 55 
selte Nachricht an A schicken, so bekommt er von A einen offentlichen Schlussel, den er zur Verschlusselung der als Lo- 
gomer reprasentierten Nachricht verwenden kann. Der offentliche Schlussel von A besteht aus einem Paar von Termina- 
toren und einem Pool zusatzlicher Scheinterminatoren mit ahnlichen Eigenschaften, jedoch abweichenden Sequenzen 
und anderen 3-Uberhangsequenzen. Von den echten Terminatoren ist lediglich die 3' Oberhangsequenz bekannt, mit der 
sie an die - offerrtlich bekannten - Elongatoren verkniipft werden kann. Zur Verschlusselung einer Nachricht erzeugt B 60 
Logomere, wobei er in der Symbolpolymerisationsreaktion den von A offentlich bereitgestellten Schlussel (enthaltend 
Terminatoren und Schemterminatoren) verwendet Die Art und Weise der Tenninatoren gewahrleistet nun, daB lediglich 
A in der Lage ist, die solcherart verschlusseite Nachricht wieder zu lesen: Da nur A die tatsachliche Sequenz der echten 
Terminatoren kennt, ist nur A in der Lage, die als Logomere verschlusseite Nachricht iiber Auslese-PCR wieder zu lesen. 

Weil der offentliche Schlussel potentiell iiber die bekannte Oberhangsequenz zu den Elongatoren angreifbar ist (weil 65 
die Scheinterminatoren diese Oberhangsequenz nicht besitzen durfen, kann ein poten tieller Angreifer eine beliebige Se- 
quenz an die echten Terminatoren kniipfen, wodurch die Sequenz der Terminatoren identifiziert werden kann)/ werden 
als Tenninatoren Molekule auf der Basis irregularer Formen, z. B. auf der Basis der in Abb* 12 gezeigten Y-formigen 
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Molekule verwendet. Die gezeigten Y-formigen Molekule lassen sich zu weiter verzweigten baumartigen Molekulen zu- 
sammensetzen. Die Wurzel eines solchen als Baum realisierten Terminatormolekuls enthalt dann die zu den Elongatoren 
kompatible Uberhangsequenz, wahrend nur eine der Aste des Baumes die echte Terminatorsequenz enthalt. Da die ver- 
schlusseite Nachricht wie oben beschrieben zusatzlich mit Scheinlogomeren versetzt ist, kann dann nur A, der die echte 
5 Terminatorsequenz kennt, aus der Menge der Molekule die richtige Nachricht durch ^rkniipfen mit dem kompatiblen 
Vektor herausflltern, wohingegen ein potentieller Angreifer ohne Kenntnis der cchten Terminatorsequenz dies nicht 
kann. 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die Verschlusselung mit Echtzeit-Idenufizierung: 
Ohne das Auslesen der in verschiiisselten Logomeren enmaltenen Informationen kann das \forhandensein der Schliissel- 

10 sequenz selbst Auskunft dariiber geben, ob ein gekennzeichnetes Produkt echt ist, oder nicht. Die Information uber die 
Authentizitat des gekennzeichneten Produktes kann dabei uber einen ProzeB, bei dem der Schlusseiprimer als Hybridi- 
sierungssonde einer Fluoreszenz-Nachweisreaktion dient, verifiziert oder falsifiziert werden. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung informationstragender Polymere, ins- 
besondere der erfindungsgemaB erhaltlichen informationstragenden Polymere, zur Verschliisselung von Information. 

15 Die oben beschriebenen Verfahren ermoglichen beispielsweise einen Test der Qualitat von Oligonukleotiden: 

Ein typisches Problem bei der Herstellung von Oligonukleotiden, z. B. fiir molekularbiologische Zwecke, ist die Quali- 
tatskontrolle derselben, die aufgrund des Herstellungsprozesses und der schwankenden Qualitat der verwendeten Che- 
mikalien problernausch ist. 

Das in den erfindungsgemaBen Schritten I-V beschriebene Verfahren kann benutzt werden, die Qualitat von Oligoriu- 
20 kleotiden zu testen. Dazu wird eine binare Grammatik wie die fur den Zufallszahlengenerator (s. o.) oder eine unare 
Grammatik wie die zur Herstellung von Molekulargewichtsstandards (s. u.) zur Erzeugung beliebig langer Logomere 
verwendet. Bei ansonsten identischen Bedingungen ist dann die Lange der aus einer Symbolpolymerisation (Schritt V 
des erfindungsgemaBen Verfahrens) erhaltenen Logomere direkt proportional zur Qualitat der verwendeten Oiigonukleo- 
tide: Je langer die elektrophoretisch sichtbar gemachten Logomere sind, desto besser ist die Qualitat der verwendeten 
25 Oligonukleotide. Ein Beispiel fur die aus einer Symbolpolymerisation erhaltene Leiter unterschiedlich langer Logomere 
fi ndet sich unter Abb. 3. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung informationstragender Polymere, ins- 
besondere der erfindungsgemaB erhaltlichen informationstragenden Polymere, zur Qualitatskontrolle synthetisch herge- 
stellter Oligonukleotide. 

30 Die oben beschriebenen Verfahren ermoglichen beispielsweise die Herstellung von Logomeren als Marker und Signa- 
tures 

Aufgrund der Fahigkeit, prinzipiell beliebige Informationen darzustellen, lassen sich die hier beschriebenen Logomere 
als Marker verwenden, urn Erzeugnisse, Produkte, Stoffe und Gerate zu kennzeichnen. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung informationstragender Polymere, ins- 
35 besondere der erfindungsgemaB erhaltlichen informationstragenden Polymere, als Marker oder Signatures 

Die Logomere konnen als "binares Etikett" verwendet werden, das einem Erzeugnis hinzugefugt wird und Informatio- 
nen uber das derart gekennzeichnete Erzeugnis enthalt. Die Logomere konnen dabei z. B. Informationen iiber 

Hersteller 

Produkt (z. B. Seriennummer) 
Verwendungszweck 
Stoffklasse 
Gefahrenklasse 
Qualitat 
Reinheit 

Produktions- und Verfallsdatum 

enthalten. Es lassen sich damit nahezu beliebige Produkte und Erzeugnisse mit nahezu beliebigen Informationen verse- 
hen. Da die Logomere ungiftig und biologisch abbaubar sind, konnen sie auch fur hochsensible Produkte wie Nahrungs 
50 mittel, Medikamente und pharmazeutische Erzeugnisse eingesetzt werden. 
Gekennzeichnete Erzeugnisse konnen z. B. sein: 

a) chemische Erzeugnisse, z. B. Lacke, Farben, Ole, Schmier- und Treibstoffe, Losungsmittel, Unte usw. 

b) flussige Materialien: Losungen, Suspensionen, Emulsionen 
55 c) gentechnische Erzeugnisse 

d) Nahrungsmittel, z. B. zur Kennzeichnung gentechnisch veranderter Bestandteile oder dem Monitoring von Nah- 
rungsmitteln wahrend des Produktionsprozesses 

e) Medikamente und pharmazeutische Erzeugnisse 

f) Papiererzeugnisse, Dokumente, Geld 
60 g) Gerate 

Der Bedarf zur Kennzeichnung von Produkten besteht in den unterschiedlichsten Bereichen und aufgrund unter- 
schiedlicher Anforderungen. Grunde fur eine Kennzeichnung konnen z. B. sein: Qualitatssicherung beim Produktions- 
prozeB, Uberwachurig der Produktreinheit und Vermeidung von Kontaminationen, Schutz vor Falschung und Produktpi- 
65 raterie, Nachweis bestimmter Produktbestandteile, Produktkennzeichnung mit beliebigen Produktinformationen. Dieser 
Bedarf stellt sich auch in besonders sensiblen Bereichen, etwa bei der Kennzeichnung von Nahrungsmitteln, medizini- 
schen und pharmazeutischen Erzeugnissen und gentechnisch hergestellten oder veranderten Erzeugnissen. Hier ist es 
wuhschenswert, daB Informauonen uber das jeweilige Produkt direkt am Produkt verfugbar sind, insbesondere wenn 
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a) 
b) 
c) 
d) 
e) 
0 
g) 
h) 
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Verwechselungen oder Falschungen vermieden werden sollen und auch die Identifikation unterschiedlicher Bestandteile 
eines Erzeugnisses gewiinscht ist. 

Es gibt zahlreiche Beispiele fur den Bedarf von Produktkennzeichnungen. Z. B. konnen Logomere als Seriennummem 
eingesetzt werden, die in Autolacke gemischt werden, wodurch der Fahrzeugh alter im Versicherungsfall (z. B. Unfall 
oder Diebstahl) identifiziert werden kann. Durch Produktkennzeichnungen konnte die Qualitat und Reinheit chemischer 5 
Erzeugnisse iiberwacht und Kontaminationen vermieden werden. Ein permanentes Problem ist die Falschung von Doku- 
menten, Unterschriften und Geld, die hochentwickelte Kennzeichnungsverfahren notig macht. 

Vor allem vor dem Hintergrund von Tierkrankheiten und -seuchen (BSE, Scbweinepest, Salmonellenvergiftungen 
usw.) stellt sich das Problem der Qualitatssicherung von Nahrungsmitteln und der Kennzeichnung von Endprodukten, 
um kontaminierte Produkte vom Verbrauch fernzuhalten. Ein weiteres Problem sind Nahrungsmittel, die gentechnisch 10 
hergestellte Bestandteile enthalten. Diese Bestandteile konnen ohne ein Kennzeichnungsverfahren im Endprodukt uber- 
haupt nicht oder nur sehr schwer nachgewiesen werden. Das Problem stellt sich insbesondere dadurch, daB viele Nah- 
rungsmittel Bestandteile unterschiedlicher Herkunft enthalten und die Produktionswege teilweise undurchschaubar sind. 

Das Problem der Kennzeichnung stellt sich z. B. auch im Bereich von Blutprodukten, wo z. B. durch Pooling Konta- 
minationen auftreten konnen. Auch ware es hier z. T. wiinschenswert, Informationen uber Identitat, Herkunft, Produkti- 15 
ons- und Verfallsdatum direkt mit dem Produkt verfugbar zu haben. Ahnliches gilt auch fur Medikamente und pharma- 
zeutische Produkte. r 

Bisher verwendet man zur Kennzeichnung und Markierung von Farben, Lacken, Treibstoffen, usw. verschiedene Koh- 
lenstoffverbindungen, Polyaniline, Fliissigkristalte oder andere chemische Verbindungen. Diese Stoffe und Verbindun- 
gen haben unterschiedliche Schwachen: sie sind z. T. toxisch, nur schwer biologisch abbaubar, die verfugbare Informa- 20 
tionskapazitat ist stark eingeschrankt, sie wechselwirken chemisch mit bestimmten Stoffen oder sind nur teuer und auf- 
wendig herzustellen. 

Fur den Einsatz zur Kennzeichnung von sensiblen und hochsensiblen Erzeugnissen wie Nahrungsmitteln oder Medi- 
kamenten sind die genannten Stofife und Verbindungen aufgrund der genannten Nachteile uberhaupt nicht geeignet. 

Die Anforderungen, die sich fur ein Kennzeichnungsverfahren von beliebigen Erzeugnissen stellen umfassen zumin- 25 
dest: 

- Die Kennzeichnung sollte direkt im oder am Erzeugnis verfugbar sein; 

- die Kennzeichnung sollte gut nachweisbar sein; 

- die Kennzeichnung muB gesundheitlich unbedenklich sein. 30 
Gegeniiber den bisher verwendeten Verbindungen haben die hier beschriebenen Logomere folgende Vorziige: 

- Kodierung beliebiger Informationen, 

- hohe Speicherkapazitat, 35 

- gesundheitlich unbedenklich, 

- chemisch, biologisch, pharmakologisch und genetisch neutral, 

- leicht biologisch abbaubar (Biomolekule), 

- keine Umweltbelastung, 

- sehr gute Nachweisbarkeit, 40 
~ hohe Kompatibilitat zu bestehenden Techniken derlriformatik und Molekularbiologie (PCR), 

- Informationen konnen verschlusselt werden und eignen sich auch zu Authentinzierung und \ferschlusselung, 

- Identifikation einzelner Bestandteile in Produktmischungen, 

- billig in groBen Mengen herzustellen (Klonierung, Vervielfaltigung mit Bakterien in Fermentem). 

. . 45 

Diese Eigenschaften machen Logomere fur die genannten Aufgaben sehr viel besser geeignet als die bestehenden 
Techniken. Uberdies erschlieBen sich Einsatzbereiche, die mit den bisherigen Techniken nicht moglich wareri. 

Aufgrund der Eigenschaften nukleinsaurebasierler Logomere konnen diese auch zur Kennzeichnung von besonders 
sensiblen Produkten wie Nahrungsmitteln und pharmazeutischen Erzeugnissen verwendet werden. 

Die Grunde dafur liegen zum einen in der chemischen Beschaffenheit nukleinsaurebasierter Logomere und zum ande- 50 
ren in der Kodierung von Informationen in Logomeren: 

1) Als Grundbausteine des Lebens" sind Nukleinsauren Elementarbausteine aller bisher bekannten biologischen 
Lebensformen. Daher konnen sie aufgrund ihrer chemischen Beschaffenheit fur keinen bekannten biologischen Or- 
ganismus schadlich sein ("biochemische Kompatibilitat"). Aufgrund der enthaltenen genetischen Informationen 55 
(des enthaltenen Programmes) konnen Nukleinsauren jedoch sehr wohl potentiell schadlich sein, wenn sie in einem 
Organismus abgelesen werden: Falls sie etwa fur giftige Proteine kodieren oder (wie im Falle viralen Erbgutes) ei- 
nen jeweiligen Zielorganismus "umprogrammieren" konnen. Die hier verwendeten Logomere konnen jedoch aus 
den im Folgenden genannten Grunden keine fur einen Organismus schadlichen Informationen enthalten. 

2) Logomere enthalten keine genetischen, d. h. biologisch relevanten Informationen ("semantische Inkompatibili- 60 
tat"): Beziiglich der enthaltenen Informationen entsprechen Logomere Buchstaben, Zahlen oder Folgen von Buch- 
staben und Zahlen in Binarkodierung, die fur uns oder einen Computer, jedoch nicht fur den genetischen Apparat ei- 
nes Organismus lesbar sind. Fur einen biologischen Organismus sind sie schlicht "Unsinnscode". 

3) Logomere, insbesondere die Algomere, aus denen sie aufgebaut sind, sind zu kurz um auch nur zufallig biolo- 
gisch relevante Informationen zu enthalten. 65 

4) Um jede Eventualitat (der unwahrscheinliche Fall, daB die Binarinformationen der Logomere auf irgendeine 
Weise von irgendeinem Organismus als genetisch relevante Information interpretiert wird) auszuschlieBen, werden 
die zur Kodierung von Symbolen verwendeten Sequenzen irri Falle sensibler Anwendungsbereiche mit Stopcodons 
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versehen, so daB sie niemals von einem biologischen Oiganismus abgelesen werden konnen. 

5) Als elementare Bestandteile aller biologischen Oiganismen sind Nukleinsaiiren in unserer Umwelt allgegenwar- 
tig. Sie werden in kurzester Zeit abgebaut. 

5 Um als Marker eingesetzt zu werden, konnen Logomere nach den in den erfindungsgemaBen Schritten I-V beschrie- 
benen Verfahren erzeugt und nach den erfindungsgemaBen oben beschriebenen Verfahren vervielfaltigt werden. Je nach 
Einsatzbereich konnen zur Vervielfaltigung der Logomere verschiedene Verfahren und verschiedene Aufarbeitungspro- 
zesse yorgenommen werden. Zur Kennzeichnung pelrochemischer Erzeugnisse z. B. konnen Logomere durch Klonie- 
rung in Bakterien vervielfaltigt werden. Um unnotige Xontaminationen zu vermeiden, konnen die erhaltenen Bakterien 

10 lysiert werden. Eine spezielle Aufreinigung der Logomer-DNA ist im Allgemeinen nicht notig. 

Zur Herstellung von Logomeren fur sensible und hochsensible Produkte ist dagegen ein aufwendigeres >fervielfalu- 
gungs- und Aufreinigungsverfahren notig. Ziei ist dabei der Erhalt moglichst reiner Logomere. Um biologische Zwi- 
schenschritte zu vermeiden, kann die Vervielfaltigung - wie erfindungsgemaB beschrieben - mit PGR vorgenommen 
werden. Sollte eine Vervielfaltigung durch Klonierung vorgenommen werden, so ist die Aufreinigung der erhaltenen 

15 DNA aus Bakterien notig. Sind die Logomere in bakteriellen Vektoren kloniert, so ist ein gezielter Abbau dieser Resi- 
stenzgene (z. B. durch Restriktionsenzyme) Bestandteil einer weiteren Aufarbeitung. 

Logomere konnen zur Kennzeichnung eines Produktes unmittelbar mit diesem verbunden werden. Sie konnen z. B. in 
fliissige StofFe gemischt werden oder auf feste Stoffe aufgebracht werden. Im Falle gentechnischer Erzeugnisse konnen 
die Logomere mithilfe von Rekombi nations- und Klonierungstechniken kovalent mit dem zu kennzeichnenden Produkt 

20 verbunden werden. 

Die Kennzeichnung von Stoffen und Produkten durch Logomere ermoglichen u. a. das Monitoring von Produktions- 
prozessen, die Qualitatskontrolle, die Identifikation einzelner Bestandteile und den quantitativen und qualitativen Nach- 
weis von Kontaminationen. 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die Kennzeichnung gentechnisch hergestellter oder 
25 veranderter Erzeugnisse: 

Die hier beschriebenen Logomere konnen zur Kennzeichnung gentechnisch hergestellter oder veranderter Erzeugnisse 
verwendet werden. 

Bisher werden insbesondere zur Identification gentechnisch hergestellter oder veranderter Erzeugnisse in Nahrungs- 
mitteln "klassische" melekularbiologische Methoden wie PGR, Restriktionsverdau, Southemblot-Hybridisierung und 
30 Sequenzierung verwendet. Mit diesen Methoden ist jedoch eirie Charakterisierung gentechnischer Erzeugnisse und Be- 
standteile noch sehr aufwendig und erfordert fur jedes zu charakierisierende Erzeugnis eigene Methoden und Verfahren. 

Insgesamt gibt es bisher kein universelles Kennzeichnungsverfahren fur gentechnisch hergestellte Erzeugnisse. Ein 
solches Kennzeichnungsverfahren muB mehrere Kriterien erfullen: 

35 - die Kennzeichnung muB gesundheitlich absolut unbedenklich sein, 

- die Kennzeichnung sollte untrennbar mit dem gekennzeichneten Produkt verbunden sein, 

- die Kennzeichnung sollte falschungssicher sein, 

- die Kennzeichnung sollte genugend Informationeri speichern konnen, 

- die Kennzeichnung sollte in geringen Mengen nachweisbar und lesbar sein. 

40 

Der Einsatz nukleinsaurebasierter Logomere zur Kennzeichnung gentechnischer Erzeugnisse erfullt diese Kriterien 
und hat daruber hinaus folgende Vorziige: 

- Logomere konnen nahezu beliebige Informationen speichern; 

45 - einzelne Bestandteile konnen schnell und hochempfindlich nachgewiesen werden; 

- zum Auslesen der Informationen kann eine bis ins Detail standardisierte Methode eingesetzt werden (Ausiesever- 
fahren nach dem erfindungsgemaBen Verfahrens, dabei konnen standardisierte Primer verwendet werden); 

- die Sequenz der gesuchten Gene kann vollkommen unbekannt sein; 

- die Sequenz der nachgewiesenen Gene kann geheim sein, ohne daB die Identifizierung oder Authentifizierung 
50 eingeschrankt ist; 

- zusatzliche Sicherheitsmechanismen konnen zusatzlich durch Verschliisselung implementiert werden. 

Im Einzelnen geht man zur Kennzeichnung von gentechnisch erzeugten oder veranderten Erzeugnissen beispielsweise 
folgendermaBen von 

55 Zur Herstellung von Markern wird eine beliebige geeignete Grammatik, z. B. wie die fur den Zufallszahlengenerator, das 
1-Byte Alphabet oder fur Zeichenketten bereits beschriebene, verwendet. Aus den mit der Grammatik erzeugten Zeichen 
werden die zur Darstellung von Markern benotigten Zeichen entnommen und dem zu kennzeichnenden Erzeugnis hin- 
zugefugt. Dazu konnen die als Logomere hergestellten Zeichen auf folgende Weise in das zu kennzeichnende Erzeugnis 
eingebracht werden: 

60 

a) durch Beimischung; hierbei werden Logomere, wie in den erfindungsgemaBen Verfahren beschrieben, herge- 
stellt, isoliert und vervielfaltigt. 

b) durch Klonierung, wie im erfindungsgemaBen Verfahren beschrieben; Abb. 6 zeigt z. B. die Kennzeichnung 
bakterieller Klone durch Logomere, die durch Verwendung der bereits beschriebenen Grammatik fiir den Zufalls- 

65 zahlengenerator hergestellt wurden. 

c) durch den Einsatz rekombinativer Techniken; hierbei werden Logomere erfindungsgemaB hergestellt, isoliert 
und vervielfaltigt. Die solcherart gewonnenen Logomere werden jetzt durch den Einsatz rekombinativer Techniken 
in das zu kennzeichnende Erzeugnis eingebracht. Dazu kann z. B. die Methoden des Gene-Targeting durch homo- 
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loge Rekombination [Capecchi M. R., Altering the genome by homologous recombination. Science, 244(4910), 
1288-1292, (1989)] oder z. B. das Cre-loxP System [Kilby, N. J., Snaith, M. R. & Murray, J. A., Site-specific re- 
combinases: tools for genome engineering, Trends Genet., 9, 413-421, (1993)] verwendet werden. Z. B. konnen er- 
findungsgemaB erhaltene Logomere mit Hilfe dieser Techniken vor oder hinter eine bestimmte Nukleinsaurese- 
quenz (Gen) gesetzt werden, die sie bezeichnen sollen. In diesem Falle wird ein Logomer gewissermaBen als "Eti- 5 
kett M an ein gentechnisches Produkt "angeheftet" und kann Auskunft uber Hersteller, Produktgruppe, Gefahren- 
klasse, Verfallsdatum o. a. geben (siehe Abb. 15). 

Das Verfahren eignet sich z. B. fiir alle Organismen (Mikroorganismen, Pflanzen, Tiere). Z. B. lassen sich Klone von 
Mikroorganismen oder Pflanzen kennzeichnen. Das Verfahren eignet sich z. B. auch fur die Kennzeichnung von Rindern 10 
zur Bekampfung der Rinderseuche BSE. 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die Kennzeichnung von Nahrungsmitteln: 
Aufgrund von Krankheiten, Seuchen c<Ier Kontaminationen konnen Nahrungsmittel gesundheitsschadlich oder gefahr- 
lich sein. Beispiele sind Krankheiten wie BSE, Schweinepest, Salmonellenvergiftungen. Es kann wunschenswert sein, 
Produkt und Hersteller identifizieren zu konnen, urn notfalls bestimmte Produkte und Produktreihen umgehend aus dem 15 
Handel zu nehmen, untersuchen zu konnen und geeignete GegenmaBnahmen zu ergreifen. 

Fiir hochsensible Erzeugnisse wie Nahrungsmittel gelten dabei die Kriterien fiir die Kennzeichnung gentechnischer 
Erzeugnisse insbesondere (siehe: Die oben beschriebenen Verfahren ermoglichen beispielsweise die Kennzeichnung 
gentechnisch hergestellter oder veranderter Erzeugnisse). 

Insgesamt gibt es auch fur gentechnisch hergestellte Nahrungsmittel bisher kein universelles Kennzeichnungsverfah- 20 
ren. Bisher ist die Identifikation gentechnisch hergestellter oder veranderter Bestandteile in Nahrungsmitteln daher roch 
schwierig und aufwendig. Es werden dazu "klassische" molekularbiologische Methoden wie PGR, Restriktionsverdau, 
Southernblot-Hybridisierung und Sequenzierung verwendet, urn diese Erzeugnisse zu charakterisieren. 

Aufgrund der Rinderseuche BSE wurde speziell fur dlie Kennzeichnung von Rindern und deren Produkten (Rind- 
fleisch und Milch) ein immunologisches Kennzeichnungsverfahren vorgeschlagen, das auf der Irnmunisierung der zu 25 
markierenden Tiere mit spezifischen Proteinen basiert ("Ohrmarke im Blut soli BSE Ririder aufspiiren", Suddeutsche 
Zeitung Nr. 283, 08.12.1998, Seite v2/9). Durch die dadurch verursachte Produkuon spezifischer Antikorper im jeweils 
gekennzeichneten Zieltier, die mutmaBlich in alien Geweben nachzuweisen ist, kann die Kennzeichnung uber einen Im- 
mun-Assay (ELISA) wieder gelesen werden. Ein solches Verfahren ist jedoch prinzipiell auf hohere Wirbeiuere be- 
schrankt AuBerdem ist die fur das Verfahren verfugbare Informationsmenge sehr begrenzt, die informationstragenden 30 
Prdteine sind nicht hitzebestandig und das Verfahren erfordert vergleichsweise hone Mengen Substanz fur Irnmunisie- 
rung und Nachweisreaktion. 

Auch im Fall von Nahrungsmitteln konnen Logomere auf Nukleinsaurebasis, wie bereits unter "Die oben beschriebe- 
nen Verfahren ermoglichen beispielsweise die Kennzeichnung gentechnisch hergestellter oder veranderter Erzeugnisse" 
beschrieben, zur Kennzeichnung eingesetzt werden. Logomere konnen dabei Informationen uber Hersteller, Verfallsda- 35 
turn, Seriennummer u. a. enthalten. Das Verfahren zur Kennzeichnung von Nahrungsmitteln ist dabei dasselbe, wie be- 
reits unter "Die oben beschriebenen Verfahren ermoglichen beispielsweise die Kennzeichnung gentechnisch hergestell- 
ter oder veranderter Erzeugnisse" beschrieben. Mithilfe der dort aufgefuhrten gentechnischen Rekombinations- und Klo- 
nierungstechniken konnen einzelne Organismen gekennzeichnet werden, sodaB ein einzelner Organismus sowie alle 
seine Nachfahren identifizierbar sind. 40 

Das Kennzeichnungsverfahren durch Logomere ermoglicht dadurch: 

- ein Monitoring des Zielproduktes uber den gesamten Herstellungs- und Verarbeitungsprozesses bis zum Endver- 
braucher, _ - 

- eine einheitliche, schnelle und einfache Identifikation einzelner Bestandteile. 45 

Als Beimischung eignen sich Logomere auf Nukleinsaurebasis zur Kennzeichnung von Getranken. 
Die oben beschriebenen Verfahren ermoglichen beispielsweise die Kennzeichnung medizinischer und pharmazeuti- 
scher Produkte: 

Aufgrund der Nichttoxizitat eignen sich Logomere auf Nukleinsaurebasis zur Kennzeichnung sensibler und hochsensi- 50 
bier Erzeugnisse. Neben Nahrungsmitteln sind dies auch medizinische und pharmazeutische Produkte. Um Verwechse- 
lungen, Kontaminationen und Falschungen ausschlieBen zu konnen, konnen Logomere z. B. medizinischen.und pharma- 
zeuuschen Produkten beigemischt werden. 

Der Vorteil der Kennzeichnung durch Logomere ist dabei, daB die Kennzeichnung unmittelbar mit dem gekennzeich- 
neten Erzeugnis verbunden ist und daB sich Erzeugnisse z. B. individuell kennzeichnen lassen. Auf diese Weise ist ein 55 
Monitoring des Herstellungsprozesses moglich, Erzeugnisse lassen sich auch nach mehrmaligem Umfullen eindeutig 
identifizieren und Kontaminationen sowie das Poolen von Proben konnen nachgewiesen werden. Mithilfe von Logome- 
ren laBt sich z. B. im Falle von Blutkonserven Herstellungs- und Verfallsdatum, Blutgruppe und Hersteller kennzeich- 
nen. * 

Die oben beschriebenen Verfahren ermoglichen beispielsweise Authentifizierung und Falschungssicherung: 60 
Logomere konnen zur Authentifizierung von Erzeugnissen, Gegenstanden und Geraten verwendet werden. Dazu werden 
Logomere vorzugsweise erfindungsgemaB erzeugt und vervielfaltigt. 

Werden solcherart erhaltene Logomere auf Erzeugnisse, Gegenstande und Gerate an-/aufgebracht oder zugemischt, so 
konnen die in Logomeren enthaltenen erfindungsgemaB jederzeit wieder ausgelesen werden '. Sollten zur Erzeugung der 
Logomere Verschlusselungstechniken verwendet werden, wie bereits beschrieben, so erfordert das Auslesen autorisier- 65 
tenZugriff. 

Beispielsweise konnen erfindungsgemaB erhaltene Logomere in wassriger Losung (vorzugsweise zu itf bis 10 18 Mor 
lekulen/ul) unmittelbar zur Kennzeichnung auf Dokumente aufgebracht werden. Als solches konnen sie als Echtheitszer- 
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tifikat des solcherart markienen Dokumentes dienen. Zum Auslesen der als Kennzeichner dienenden Logomere wird ein- 
fach ein kleines Schnipsel des Papiers (1 mm 2 ist ausreichend) als Template einer erfindungsgemaBen PCR-Auslesere- 
aktion verwendet. Ein Beispiel findet sich in Abb. 16. 

In dem zugrundeliegenden Ausleseexperiment wurde zum Test des Prinzips ein Logomer in wassriger Losung in ca. 
5 1 0? Molekulen/ul auf 3M Postlt Papier ca. 1 Stunde getrocknet und 1 mm 2 des Post-Its als Template einer Auslese-PCR 
verwendet. Es konnen Dokumente beliebiger Papicrqualitat verwendet werden, z. B. 80 g/m 2 Standardkopierpapier. 

Dasselbe Verfahren eignet sich auch zur Kennzeichnung von Geld oder Geldscheinen, wobei hier \fcrteile darin beste- 
hen, 

10 - auch bereits gedruckte Scheine markieren zu konnen, 

- Seriennummern vergeben zu konnen, 

- Verschlusselung einzusetzen. 

Urn Dokumente moglichst in Echtzeit auf Authentizitat priifen zu konnen, kann einer der zum Auslesen in der PGR be- 
ts nutzten Primer auch als Hybridisierungsonde fur eine nachfolgende Farbe-Nachweisreaktion (z. B. mit einem interkalie- 
renden Farbstoff, z. B. Ethidiumbromid) verwendet werden. 

Ein weiteres Beispiel ist die Authentifizierung flussiger Losungen, Suspensionen und Emulsionen mit Logomeren. So 
kann etwa Unte mit Logomeren individuell markiert werden, so daB Unterschrifteh damit auf Echtheit uberpriift werden 
konnen. 

20 Ein weiteres Beispiel ist die Kennzeichnung von Automobilen durch das Versetzen des Autolackes mit Logomeren. 
Dabei werden Logomere dem Autolack (oder anderen Bestandteilen des KFZ) als Beimischung zugesetzL Die zugesetz- 
ten Logomere konnen dabei Informationen uber Seriennummer, Hersteller, Fahrzeugtyp o. a. Angaben enthalten. Auf- 
grund dieser Informationen kann im Falle von Unfall, Diebstahl oder illegaler Entsorgung ein Fahrzeug identifiziert wer- 
den. Ein Vorteil der hier beschriebenen Methode liegt darin, daB schon Lackspuren zur Identifikation des Fahrzeuges aus- t 

25 reichen, was insbesondere bei Unfallen von Interesse sein kann. Ein weiterer \brteil ist, daB die Identitat eines Fahrzeu- 
ges nur sehr aufwendig zu falschen ist. Dazu muBten erstens alle gekennzeichneten Bestandteile entfernt, zweitens eine 
gefalschte Identitat eingerichtet werden. Dieses Unterfangen ist alleine durch den mechanischen Aufwand sehr schwie- 
rig, auBerdem laBt sich durch den Einsatz kryptografischer Methoden das Nachmachen und Nachahmen von Kennungen 
beliebig erschweren. Zum Auslesen der als Logomere enthaltenen Informationen, werden die Logomere aus dem Lack 

30 isoliert und konnen dann wie in der Beschreibung zum Auslesen der in Logomeren enthaltenen Information, vorzugs- 
weise durch PGR, ausgelesen werden. Dazu wird eine Probe des Lackes entnommen, mit einem geeigneten Losungsmit- 
tel (Terpentin o. a.) gelost und mit gleichem Volumen Wasser versetzt. Durch nachfolgende Zentrifugation werden hy- 
drophile und hydrophobe Bestandteile getrennt. Daraufhin nimmt man die wassrige Phase auf (worm sich die hydrophi- 
len nukleinsaurebasierten Logomere befinden) und fallt die enthaltenen Logomere nach den ublichen Methoden (z. B. 

35 wie in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular Gloning, A Laboratory Manual, (1989)] beschrieben). Nach 
der Fallung konnen die erhaltenen Logomere nach den erfindungsgemaBen Verfahren, z. B. durch Auslese-PGR, ausge- 
lesen werden. 

Daher sind weitere Gegenstande der vorliegenden Erfindung die Verwendungen informationstragender Polymere, ins- 
besondere der erfindungsgemaB erhaltlichen informationstragenden Polymere, zum Zwecke der Qualitatssicherung, der 

40 Falschungssicherung, der Kennzeichnung von Lebensmitteln, der Kennzeichnung gentechnischer, chemischer, medizi- 
nischer und pharmazeutischer Erzeugnisse, der Kennzeichnung von Organismen, der Kennzeichnung von Dokumenten, 
der Kennzeichnung von Geld, der Kennzeichnung yon Gegenstanden und Maschinen, der Kennzeichnung von Losun- 
gen, Suspensionen und Emulsionen sowie der Authentifizierung von Perspnen und Gegenstanden. 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die Herstellung von Molekulargewichtsstandards: 

45 Zu den typischen Verfahren der molekularbiologischen Analytik gehort die elektrophoretische Langenauftrennung von 
DNA- und RNA-Fragmenten. Um die Lange solcher Fragmenten bei der Elektrophorese zu bestimmen, verwendet man 
ubhcherweise einen Molekulargewichtsstandard ("Leiter rt ), der Fragmente bekannter Lange enthalt und zum Vergleich 
mit den Fragmenten der zu analysierenden Proben dient. 

Bisher gibt es Molekulargewichtsstandards, die entweder unregelmaBige Leitem enthalten (z. B. Boehringer V, Boeh- 

50 ringer Mannheim, Katalog Nr.: 821 705) oder regehnaBige Leitern mit regelmaBigen Fragment-Langenabstanden (z. B. 
50 bp Leiter Gibco BRL, Life Technologies, Katalog Nr. 10416-014). Keine der bisherigen Leitern hat dabei kurzere 
Langenabstande als 10 bp (z. B. 10 bp Leiter Gibco BRL, Life Technologies, Katalog Nr. 10821-015). 

Mit den hier beschriebenen Verfahren konnen gezielt DNA Fragmente verschiedener Lange und definierter Langen- 
abstande hergestelli werden. Diese Fragmente konnen als Molekulargewichtsstandards genutzt werden, wobei das Ver- 

55 fahren erlaubt, prinzipiell beliebige Langen und beliebige Langenabstande zu realisieren. Insbesondere sind Langenab- 
stande bis hinab zu 1 bp Abstand, also Molekulargewichtsstandards hochster Auflosung, moglich. / 

Das Verfahren beruht darauf, Logomere als Template einer Auslese-PCR zu verwenden, deren Resultat ein Gemisch 
von DNA Fragmenten definierter Lange und definierter Langenabstande ist Es ba^iert auf den bereits beschriebenen er- 
findungsgemaBen Verfahren zur Erzeugung und dem Auslesen von Logomeren. 

60 DNA Fragmente verschiedener Lange in sehr kurzen, regelmaBigen Abstanden konnen erhalten werden, wenn ein 
unares Polymer als Template einer Auslese-PCR mit verschachtelten Primern fungiert Der 5-Primer primt in der Start- 
Sequenz des Polymers. Als gegenlaufige 3' Primer fungiert eine Gruppe von Primern, die verschachtelt in dem Elongator 
ansetzt (in Abb. 17 dargestellt als 3 Ebehen gegeneinander versetzter Primer). Da das Polymer aus Wiederholungen nur 
eines Elongator-Molekiils besteht, erhalt man fiir n Wiederholungen und m verschachtelte 3' Primer n • m Banden. Das 

65 Verfahren funktioniert auch spiegelbildlich mit einem im Ende-Terminator primenden Primer und dementsprechen ge- 
genlaufigen 5' Primern. Die erhaltenen Banden konnen als Molekulargewichtsstandards z. B. in Elektrophoresen einge- 
setzt werden. 

Fur hochauflosende Molekulargewichtsstandards ist die Verwendung unarer Logomere und verschachtelter Primer am 
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zweckmaBigsten. Jedoch istdas Verfahren nicht darauf beschrankt, da im Prinzip alle im erfindungsgemaBen SchrittI be- 
schriebenen Grammaliken verwendet werden konnen. 

Unare Logomere beliebiger Lange konnen mit einer Grammatik G = (£, V, R, S) mil Terminalalphabet L: = {0, s, e), 
Variablenmenge V: = {A}, Startsymbol S und Regelmenge 

R:= ^ 5 

{ 

S: = sA 
A — * aA 
A-^e 

} 10 
hergestellt werden. Sollte es notig sein, unare Logomere definierler Lange herzustellen, muB dementsprechend die Va- 
riablenmenge und damit auch die Zahl der Elongatoren groBer gewahlt werden (wie z. B. in der Grammatik zur Imple- 
mentierung eines 1-Byte Alphabets bereits beschrieben). Je nach gewunschter Lange der zu erzeugenden DNA Frag- 
mente kann auBerdem die Lange der Algomere variiert werden. 

Die so erzeugten Logomere konnen nach den erfindungsgemaBen Verfahren vereinzelt und vervielfaltigt werden. 15 
Das Erzeugen von DNA-Fragmenten definierter Lange und definierter Langenabstande erfolgt vorzugsweise mit PGR 
analog dem erfindungsgemaBen Verfahren zum Auslesen von Logomeren. Fiir hochauflosende Molekulargewichtsstan- 
dards wird pro Elongator mindestens ein Primer, meistens sogar eine Anzahl mehrerer Primer verwendet, die gegenein- 
ander verschoben sind. Die Anzahl der Primer pro Elongator ist abhangig von den gewunschten Langenabstanden. 1st 
etwa gewiinscht, Algomere der Lange 30 bp zu verwenden und sollen die Langen der erzeugten DNA Fragmente jeweils 20 
10 bp Unterschied haben, so sind pro Elongator drei Primer, die jeweils genau 10 bp gegeneinander verschoben sind, ein- 
gesetzt werden. 

Fiir die Synthese von Sequenzen zur Herstellung von Algomeren und Logomeren mussen die Anforderungen erfullt 
werden, die bereits unter Schritt II des erfindungsgemaBen Verfahren s beschrieben wurden. Insbesondere gewahrleistet 
das verwendete NFR- Verfahren dadurch, daB die jeweils als Template dienenden Teilsequenzen einen gleichen GC-An- 25 
teil besitzen konnen, den Einsatz verschachtelter Primer und die Ausgewogenheit des AT/GC Verhaltnisses der erzeugten 
DNA Fragmente. Letzteres ist insbesondere angesichts dessen entscheidend, daB das Laufverhalten von DNA Fragmen- 
ten in der Elektrophorese nicht nur von der Lange, sondern auch von derZusammensetzung der Fragmente abhangt. Dies 
gilt insbesondere fur hochauflosende Molekulargewichtsstandards in denen es nur sehr geringe Langenabstande gibt. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung informationstragender Polymere, ins- 30 
besondere der erfindungsgemaB erhaltlichen informationstragenden Polymere, zur Herstellung von Molekulargewichts- 
standards. ■ 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die Herstellung polymerer Datenspeicher: 
Die beschriebenen Logomere konnen als RAM (Lesen und Schreiben) und ROM (nur Lesen) Datenspeicher hober Ka- 
pazitat und niedrigen Energieverbrauchs genutzt werden. Um eine moglichst hohe Informationsdichte zu gewahrleisten 35 
und die Handhabung des Speichers moglichst einfach zu machen, werden die Logomere an einen festen Trager gebun- 
den. Dies gewahrleistet, daB die Logomere einzeln adressiert, d. h. einzeln geschrieben, gelesen und geloscht werden 
konnen (siehe Abb. 9). 

Die benotigten Schreib- und Leseoperationen werden auf der Basis der im erfindungsgemaBen Schritt V und der unter 
Auslesen der in Logomeren enthaltenen Information beschriebenen enzymatischen Reaktionen durchgefuhrt, die ihrer- 40 
seits durch Temperaturanderungen gesteuert werden. Die Temperaturanderungen konnen entweder per Laser oder durch 
Erhitzen und Abkiihlen des festen TYagers z. B. in einem Thermozykler durchgefuhrt werden. 

Zum Schreiben wird eine Modification des oben beschriebenen Verfahrens der Symbolpolymerisation verwendet. Die 
Polymerisation findet an einem festen TVager statt, die Algomere werden durch wiederholte Restriktions-LigaUonszyklen 
miteinander verkettet. 45 

Um einzelne, adressierbare Speicherzellen herzusteUen, werden in bestiinmten Abstanden einzelstrangige "Ankermo- 
lekiile" irreversibel (durch UV-Bestrahlung oder im Ofen) an den Trager gebunden. Der solcherart mit Ankermolekulen 
versehene Trager kann nun reversibel mit Logomeren beschrieben werden, die in einem Loschvorgang wieder davon ent- 
fernt werden konnen. 

Bei einem Schreibvorgang werden zuerst spezifische Algomere ("Starter- Algomere") durch Hybridisierung an die An- 50 
kermolekiile gebunden. Diese Starter- Algomere sind ihrerseits Ausgangspunkt einer Symbolpolymerisation, bei der wei- 
tere Algomere miteinander verkettet werden. Die Verkettung der Algomere erfolgt dabei, abweichend von dem im 
Schritt V des erfindungsgemaBen Verfahrens beschriebenen Vorgehen, durch wiederholte Zyklen von Restriktion und Li- 
gation. Bei jedem Zyklus wird das jeweils letzte Algomer einer polymerisierenden Kette mit einem Restriktionsenzym 
geschnitten, so daB eine einzelstrangige Uberhangsequenz (Elongationspunkt) entsteht, an die seinerseits das nachstfol- 55 
gende Algomer durch Ligation gebunden werden kann. 

Fiir deri solcherart beschriebenen Schreibvorgang mussen die Algomere ein spezifisches Design aufweisen: 

a) Jedes zu schreibende Algomer besitzt eine einzelstrangige Uberhangsequenz, mit der es an den Elongations- 
punkt eines Logomers binden kann. 60 

b) Ein Algomer, das nur eine einzelstrangige Uberhangsequenz besitzt mit der es an einen Elongationspunkt binden 
* kann, selbst aber keine Restriktionsschnittstelle besitzt, durch die es von Restriktionsenzymen erkannt werden kann 

und damit nicht als Elongationspunkt dienen kann, heiBt Ende-Algomer. 

c) Jedes zu schreibende Algomer, das nicht das Ende-Algomer ist, besitzt ein doppelstrangiges Ende, worin sich die 
Erkennungssequenz fur das jeweils gewahlte Restriktionsenzym befindet. Bei einer Restriktion spaltet das Enzym 65 
das Algomer, so daB eine einzelstrangige Oberhangsequenz entsteht, die ihrerseits selbst wieder als Elongations- 
punkt dienen kann. 

d) Jedes fertige Logomer besitzt genau ein Starter- und ein Ende-Algomer. Starter- und Ende- Algomere sind, ent- 
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sprechend der oben gegebenen Definition, Terminatoren. 

e) Die Uberhangsequenzen der Algomere sind kompatibel zu einem jeweils gewahlten Restriktionsenzy m, so daB 
ein zu verkettendes Algomer an den Elongationspunkt eines Logomers binden kann und der nachfolgend durch Re- 
striktion entstehende Elongationspunkt identisch zu seinem \fcrlaufer ist. 
5 f) Die im Algomer auf die Uberhangsequenz folgende Sequenz ist solcherart gewahlt, daB ein verkettetes Algomer 

durch einen nachfolgenden Restriktionsvorgang nicht wieder abgespalten werden kann. 

Als fester Trager eignen sich Membranen wie Gene Screen Plus (DuPont, Biotechnology Systems, Katalog Nr.: NEF- 
986 oder NEF-987), Hybond-N (Amersham Life Sciences, Katalog Nr.: RPN 82N oder RPN 137 N), Silizium-, Silicat- 
10 Oberflachen oder Glas. Die Ankermolekiile werden jeweils kovalent daran gebunden (UV-Bestrahlung oder Hitze). 

Damit die Molekule einzeln adressierbar sind, miissen sie in regelmaBigen Abstanden auf dem Trager angebracht wer- 
den. 

Als Restriktionsenzyme eignen sich handeisubliche Enzyme, vorzugsweise solche, die nicht bei 65°C deaktiviert wer- 
den (z. B. Hindm). 

15 Die Schreiboperationen basieren darauf, daB die zum Schreiben verwendeten Enzyme unterschiedliche Temperatur- 
optima haben. So liegt das Temperaturoptimum der zum Verketten von Symbolen verwendeten Ligase bei 16°C, wohin- 
gegen die benotigten Restriktionsenzyme nur bei 37°C funktionieren. Dadurch ist das getaktete Schreiben von Symbolen 
in Zyklen von Restriktion und Ligation moglich. 

Da alle Lese- und Schreiboperationen mithilfe von Enzymen durchgefuhrt werden, ist es notig, den TVager temperieren 

20 zu konnen. Dabei konnen, bei der Verwendung eines Thermozyklers und thermomanipulierbaren Materials, alle Spei- 
cherzellen simultan derselben Operation unterworfen werden. Altemativ konnen Speicherzelllen einzeln und unabhan- 
gig voneinander zugegriffen werden, wenn ein entsprechend kleiner Schreib-ZLesekopf eingesetzt wird. Dieser Schreib- 
/Lesekopf muB einerseits als Pipettiervorrichtung fur die benotigten Molekule (Enzyme, Algomere) dienen und anderer- 
seits die fur eine bestimmte Manipulation benotigte Temperatur erzeugen (z. B. mit Hilfe eines Lasers). | 

25 Beim Loschvorgang wird ein Logomer durch Denaturierung vom jeweiligen Ankermolekul gelost. Das Ankermolekul 
steht danach wieder fur einen Schreibvorgang zur Verfugung. Fiir einen Lesevorgang wird ein Logomer durch Denatu- 
rierung. von einem Ankermolekul gelost. Es kann dann nach den erfindungsgemaBen Verfahren ausgelesen werden. 

Die beschriebenen Operationen Schreiben, Loschen, Lesen werden durch Enzyme bei verschiedenen Temperaturen 
durchgefuhrt. Dabei konnen, bei der Verwendung eines thermomanipulierbaren Materials, alle Speicherzellen simultan 

30 derselben Operation unterworfen werden. Alternativ konnen Speicherzelllen einzeln und unabhangig voneinander zuge- 
griffen werden, wenn ein entsprechend kleiner Schreib-/Lesekopf eingesetzt wird. Dieser Schreib-ZLesekopf muB einer- . 
seits als Pipettiervorrichtung dienen und andererseits die fur eine bestimmte Manipulation benotigte Temperatur erzeu- 
gen. 

Der Vorteil des hier vorgesteilten Polymerspeichers besteht gegeniiber den bisher verwendeten Materialien in einer 
35 hoheren Speichendichte (DNA Molekule haben eine GroBe, die bei 10" 10 m liegt), und einem sehr viel geringeren Ener- 
gieverbrauch (zur Berechnung der in enzymatischen Reaktionen benotigten Energie siehe [L. M. Adleman, Molecular 
Computation of Solutions to Combinatorial Problems, Science, 266, 1021-1024, (1994)]). AuBerdem ergibt sich eine er- 
heblich verbesserte Umweltvertraglichkeit, weil die hier beschriebenen Polymere Biomolekiile ohne jegliche Toxizitat 
sind. 

40 Der hier beschriebene Ansatz hat gegeniiber den bisher fur das DNA Computing verwendeten wassrigen Losungen 

den Vorzug hoherer Speichendichte und der Adressierbarkeit einzelner Polymere. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher ein pplymerer Datenspeicher, umfassend erfindungsge- 

maBe informationstragende Polymere, erfindungsgemaBe Verfahren zur Verknupfung von Molekulen, erfindungsgemaBe 

Ausleseverfahren oder erfindungsgemaBe Isolierungs- und Vervielfaltigungsverfahren. 
45 Die oben beschriebenen Verfahren ermoglichen beispielsweise die Herstellung eines DNA Computers: 

Mithilfe der bereits beschriebenen Informationsdarstellung durch Algomere und Logomere kann ein DNA Computer ) 

konstruiert werden. Der DNA Computer umfaBt (s. Abb. 10): 

a) Oligonukleotidsynthesizer 
50 b) Thermozykler 

c) Pipettiervorrichtung 

d) Vorrichtung zur Isolation von Polymeren 

e) Vorrichtung zur Auftrennung von Nukleinsauren, z. B. Elektrophoresesystem 

f) Scanner 

55 g) Steuerungsrechner (Workstation, z. B. PC) 

Der DNA Computer ist konstruiert als ein Hybridsystem, bei dem einfache, rechenintensive Algorithmen oder die 
Speicherung von Daten mithilfe von DNA und den dazu benotigten Geraten (Gerate a) bis e)) vorgenommen werden und 
ein herkommlicher Computer (vorzugsweise Workstation, z. B. PC) als Host und Steuerungsrechner dient. 

60 Der DNA Computers beinhaltet mindestens einen Thermozykler, der als "Informationsreaktor" dient und uber den 
Steuerungsrechner gesteuert werden kann (z. B. MJ Research PTC- 100, Eppendorf Mastercycler). In den Tubes oder Mi- 
krotiterplatten des Thermozyklers befinden sich Molekulgemische aus Nukleinsauren, Enzymean und weiteren chemi- 
schen Substanzen (z. B. Puffer, Nukleotide), die fur die Algomer- Assemblierung (Schritt IV des erfindungsgemaBen Ver- 
fahrens) und die Symbolpolymerisation (Schritt V des erfindungsgemaBen \ferfahrens) benotigt werden. I^rogrammiert 

65 wird der DNA Computer durch die Implementierung von Algorithmen als Grammatiken (Schritt I des erfindungsgema- 
Ben Verfahrens). Die fur dlie Grammatiken jeweils benotigten Monomersequenzen werden durch das NFR- Verfahren 
und die Benutzung eines Oligonukleptidsynthesizers (z. B. ABI 392, ABI 398, ABI 3948 von Perkin-Elmer Applied Bio- 
systems) hergestellt (Schritte II und EI des erfindungsgemaBen Verfahrens). Diese Monomersequenzen gehen als Input 
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in den Thermozykler ein, in dem die Algomer-Assembiierung (Schritt IV des erfindungsgemaBen Verfahrens) stattfindet. 

Die so gewonnenen Algomere werden in eine oder mehrere Reakuonskammern des Thermozyklers uberfuhrt, wo sie 
zu Logomeren verknupft werden (Symbolpolymerisation, Schritt V des erfindungsgemaBen Verfahrens). Die so gewon- 
nen Logomere werden in einer eigenen Vorrichtung isoliert und vervieiraltigt. Diese Vorrichtung kann nach den Prinzi- 
pien arbeiten, die in dem erfindungsgemaBen Verfahren beschrieben worden sind. Nach Isolierung und Vervielfaltigung 5 
konnen die Logomere gelesen werden. Dazu werden sie wiederum in einem Thermozykler erfindungsgemaB ausgelesen. 
Die aus dem Ausleseverfahren resultierenden Nukleinsaurefragmente konnen, wie bereits beschrieben, durch Gelelek- 
trophorese gelesen werden. Hier dient das Gelelektrophoresegerat als Ausgabegerat des DNA Computers, die solcherart 
erhaltenen Bandenmuster werden von einem Scanner in den Steuerungsrechner eingelesen. 

Der Steuerungsrechner nimmt jetzt seinerseits aufgrund der solcherart erhaltenen Ergebnisse weitere Berechnungen 10 
und Steuerungen vor und setzt ggfs. weitere molekulare Reaktionen in Gang. Z. B. kann der Steuerungscomputer auf- 
grund erhaltener Ergebnisse die Neuimplementierung von Grammatiken (Herstellung von Oligomeren mit dem NFR- 
Verfahren) veranlassen. Auf diese Weise konnen die durch molekulare Verfahren als Logomere erhaltenen Informationen 
nicht nur als passive Daten sondern auch als Instruktionen (und Adressen) dienen. Dadurch ist ein sich selbst steuernder 
ProzeB verschiedener Algorithmen moglich, der fur eine universelle Datenverarbeitung notig ist. 15 

Der DNA Computer verarbeitet dabei Informationen als Oligo- und Poiymere. Als Speicherzellen der Daten dienen 
Klonierungsvektonen (Plasmide), die sich in fliissiger Losurig oder auf einem festen, adressierbaren Trager befinden. 

Der DNA Computer ist wie oben beschrieben mittels Grammatiken programmierbar und kann von einem herkommli- 
chen Computer, der als Steuerungsrechner und Host-System fungiert, gesteuert werden. Da der DNA Computer be- 
stimmte Operationen in molaren GroBenordnungen (z. B. die Symbolpolymerisation, wie in Schritt V des erfindungsge- 20 
maBen Verfahrens beschrieben, in lO^-lO 20 Elementaroperationen pro Sekunde) vornehmen kann, ist eine mogliche 
Anwendung die Berechnung einfacher, rechenintensiver Algorithmen. Jedoch kann der DNA Computer auch fur andere 
Anwendungen, z. B. die Erzeugung bestimmter, regelmaBiger DNA Strukturen, die z. B. innerhalb der Nanotechnologie 
interessant sind, verwendet werden. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher ein DNA-Computer, umfassend erfindungsgemaBe in- 25 
formationstragende Poiymere. Ein weiterer Gegenstand der vorliegenden Erfindung ist ein DNA-Computer, in dem ein 
erfindungsgemaBes Ausleseverfahren und/oder erfindungsgemaBe Isolierungs- und Vervielfaltigungsverfahren einge- 
setzt werden. 

Die oben beschriebenen Verfahren ermoglichen beispielsweise die Herstellung kleinster moiekularer Strukturen mit \ 
Logomeren: 30 
Mit den hier beschriebenen Logomeren lassen sich kleinste molekulare Strukturen (Nanostrukturen) herstellen. Bau : 
steine solcher Strukturen sind Algomere, die zu regelmaBigen Mustem von Logomeren zusammengefugt werden kon- 
nen. Z. B. konnen verschiedene Algomere mit unterschiedbchen Fremdmolekulen (Liganden) dotiert werden, um regel- 
maBige, hohermolekulare Muster der jeweiligeh Liganden zu erhalten. Die Logomere fungieren dabei als "Skelett" mo- 
iekularer Baugruppen von Liganden. 35 

Z. B. konnte ein binares Logomer alternierende Muster leitfahiger und nicht-leitfahiger Liganden enthalten. Durch die 
Anordnung vieler Logomere auf einem festen Irager konnen so Leiterbahnen im Nanometerbereich entstehen. 

Als Liganden konnen aber auch Biomolekiile, Antikorper, optisch aktive Molekule o.a. verwendet werden. 

Logomere konnen als "intelligenter" KlebstofF eingesetzt werden (siehe Abb. 1 8). Dabei macht man sich die Hybridi- 
sierung komplementarer Nukleotide zunutze. Bringt man auf die zu verklebenden Flachen Logomere auf, die etwa ko- 40 
valent an die zu verklebenden Flachen gebunden werden, so konnen ansonsten vollig identische Flachen nur dann ver- 
kleben, wenn sie komplementare Sequenzen aufweisen, da nur jeweils Flachen komplementarer Nukleinsauren Wasser- 
stofTbruckenbindungen ausbilden. Die "Intelligenz" des Klebstoffes besteht also in einer durch die jeweils verwendeten 
Sequenzen hochselektiven Adhasionswirkung. Dabei kann auch die Adhasionsstarke fiir zu verklebende Flachen genau 
eingestellt werden: Zum einen kann iiber die Dichte der Logomere auf den jeweiligen Rachen deren Adhasionsstarke 45 
eingestellt werden, zum anderen kann iiber das AT/GC Verhaltnis der Logomere deren Schmelzpunkt variiert werden, so 
daB verklebte Hachen bei unterschiedlichen Temperaturen ihre Adhasion verlieren. Aufgrund der Tatsache, daB hier un- 
schadliche, leicht abbaubare Biomolekiile als KlebstofF verwendet werden, konnen derartige KlebstofFe auch zur medi- 
zinische Verwendung (z. B. Chirurgie, Mikrochirugie) eingesetzt werden. Eine andere Verwendung ist die Nutzung des 
beschriebenen Verfahrens in Hochprazisions- und Authentifizierungsanwendungen. 50 

Versetzt man die zur Herstellung von Logomeren verwendeten Algomeren mit Sequenzen zur Bindung von Liganden, 
so konnen starkere Adhasionswirkungen erreicht werden. Solche Liganden konnen im Falle von DNA DNA-bindenden 
Proteinen, z. B. spezifische, gegen DNA-Sequenzen gerichtete Antikorper sein. Diese konnen z. B. jeweils iiber einen 
weiteren Liganden untereinander verbunden werden (siehe Abb. 19). Eine einfache, nichtprogrammierbare Adhasions- 
wirkung kann auch ohne Logomere erreicht werden, wenn die verwendeten Proteine (z. B. Antikorper) ihrerseits an die 55 
zu verklebenden Flachen binden konnen (wie z. B. Antikorper, wenn die zu verklebende Hache ihr Antigen ist). Siehe 
dazu auch Abb. 20. Einfachere Klebstoffe sind moglich, wenn, an bestimmte Flachen spezifisch bindende, Proteine gen- 
technisch hergestellt werden. 

Mit Logomeren konnen Oberflachen unterschiedlichster Struktur und unterschiedlichster physikalischer Eigenschaf- 
ten hergestellt werden. Den Anwendungen ist gemein, daB sich mit den Logomeren nahezu beliebige Muster im Nano- 60 
meterbereich bilden lassen, die das Skelett kleinster moiekularer Bauelemente sein konnen. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung informationstragender Poiymere, ins- 
besondere der erfindungsgemaB erhaltlichen informationstragenden Poiymere, zur Herstellung oder Bearbeitung klein- 
ster moiekularer Strukturen oder als moiekularer Kleber. 
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Patentanspruche 

1. Verfahren zur Herstellung von informationstragenden Polymeren, das unifaBt, 

I. eine regulare Grammatik G = (Z, V, R, S) mit einem endlichen Terminalalphabet £, einer endlichen Varia- 
blenmenge V, einer endlichen Regelmenge R und einem Startsymbol S zu definieren; 
n. das NFR- Verfahren (Niehaus-Feidkamp-Rauhe- Verfahren) zur Herstellung yon Monomersequenzen; 
HI. mit dem NFR- Verfahren eine in Schritt I definierte Grammatik zu implementieren, indem damit Mono- 
mersequenzen hergestellt werden, die die Regelmenge R einer Grammatik G eindeutig darstellen; 
IV. aus den in Schritt HI hergestellten Monomersequenzen fur jede Regel der Regelmenge R von G ein die Re- 
gel reprasentierendes Oligomer zusammenzusetzen; 

V die in Schritt IV zusammengesetzten Oligomere zu informationstragenden Polymeren zu verkniipfen. 
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2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daB das Tenninalalphabet X einer Grammatik G die Ter- 
minate 0, 1, n Startterminale s (sq, Si, . . Sn) und m Endterminale e (eo, ei, . . ., e m ), enthalt, wobei n und m jeweils 
groBer oder gleich 0 sind und eine naturliche Zahl darstellen. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daB die in Schritt III konstruierte Monomersequenz 
Nukleotide, insbesondere Ribonukleotide, besonders bevorzugt Desoxyribonukleotide umfaBt. 

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daB die in Schritt HI konstruierte Monomersequenz Pro- 1 
teinerkennungssequenzen (z. B. Restriktionsschnittstellen, Proteinbindungsstellen, Stopcodons) umfaBt. 

5. Verfahren nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, daB man die Synthese der Mo 
nomersequenzen in Schritt II und HI in vitro, vorzugsweise mittels eines Oligonukleoud-Synthezisers vornimmt. 

6. Verfahren zur Isolierung und Vervielfaltigung von informationstragenden Polymeren, die nach einem der vorher- 
gehenden Anspriiche erhalten wurden, dadurch gekennzeichnet, daB man in Schritt V erhaltene informationstra- 
gende Polymere in Klonierungsvektoren ligiert, kompetente Zellen mit diesen Vektoren transformiert und die er- 
folgreich transformierten Bakterien anhand von Selektionsmarkern selektioniert. 

7. Verfahren zum Auslesen von Information aus informationstragenden Polymeren, die nach einem der vorherge- 
henden Anspriiche erhalten oder isoliert und vervielfaltigt wurden, dadurch gekennzeichnet, daB man 

a) mindestens n-1 das informationstragende Polymer enthaltende Losungen mit jeweils einem Paar gegenlau- 
figer Primer versetzt, wobei n fur die Zahl der als Elongatoren in dem Polymer enthaltenen Oligomere steht; 

b) mindestens n-1 PCR-Ansatze durchfuhrt, wobei n fur die Zahl der als Elongatoren in dem Polymer enthal- 
tenen Oligomere steht und jeweils ein Primer eines jeden Paares in dem dem Elongator gegenuberliegenden 
Terminator primt und der andere Primer in dem Elongator selbst primt; 

c) die aus der PCR erhaltenen Polymer-Fragmente nach ihrer Lange durch Elektrophorese auftrennt und 

d) das aus der Elektrophorese erhaltene Muster optisch ausliest. 

8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daB das Auslesen in Schritt d) automatisiert durch einen 
Scanner oder eine Sequenziermaschine erfolgt. 

9. Informationstragendes Polymer, erhaltlich nach einem der Anspriiche 1 bis 6. 

10. Zufallszahlengenerator, umfassend informationstragende Polymere, insbesondere Polymere nach Anspruch 9. 

11. Polymerer Datenspeicher, umfassend informationstragende Polymere nach Anspruch 9. 

12. DNA-Computer, umfassend informationstragende Polymere nach Anspruch 9. 

13. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur Herstellung von Molekulargewichts- 
standards. 

14. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur Darstellung von Datenstrukturen. 

15. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 als Marker 
oder Signaturen. 

16. Verwendung von informationstragenden Polymeren, insbesondere yon Polymeren nach Anspruch 9 zum 
Zwecke der Qualitatssicherung. 

17. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum 
Zwecke der Falschungssicherung. 

18. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum 
Zwecke der Kennzeichnung gentechnischer Erzeugnisse. 

19. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum 
Zwecke der Kennzeichnung von Lebensmitteln. 

20. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum 
Zwecke der Kennzeichnung von Organismen. 

21. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum 
Zwecke der Kennzeichnung chemischer Erzeugnisse. 

22. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum 
Zwecke der Kennzeichnung medizinischer und pharmazeutischer Erzeugnisse. 

23. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum 
Zwecke der Kennzeichnung von Dokumenten. 

24. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum 
Zwecke der Kennzeichnung von Geld. 

25. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum 
Zwecke der Kennzeichnung von Gegenstanden und Maschinen. 

26. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum 
Zwecke der Kennzeichnung von Fiussigkeiten, Losungen, Suspensionen oder Emulsionen. 

27. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zur Ver- 
se hliisselung von Information. 

28. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum 
Zwecke der Authentisierung von Personen und Gegenstanden. 

29. Verwendung von informationstragenden Polymeeren, insbesondere von Polymeren nach Anspruch 9 als mole- 
kulare Kleber. 

30. Verwendung von informationstragenden Polynneren nach Anspruch 9 zur Herstellung oder Bearbeitung klein- 
ster molekularer Strukturen. 

31. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur Qualitatskontrolle synthetisch herge- 
stellter Oligonukleotide. 
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